SAMURAI增强版分割模型
1. 背景
最近在11月18日看到arxiv上发表了SAMURAI,是华盛顿大学做的一个针对万物切割SAM(segment anything model)的开源项目,目的是为了解决传统目标跟踪算法在复杂场景比如快速移动、移动遮挡等环境中遇到的跟踪丢失、目标不全等问题。其实在去年华盛顿大学已经开源过一个版本SAM,不过相比于SAM,SAMURAI具备更好的性能,在物体部分遮挡的时候依旧有很好的性能。关于官网的产品介绍如下:
网站:https://yangchris11.github.io/samurai
论文:https://arxiv.org/abs/2411.11922
github:https://github.com/yangchris11/samurai
视频案例如下:
1917 (2019), directed by Sam Mendes.
1917 (2019), directed by Sam Mendes.
可以看到官网的案例,整体视频追踪的效果看起来还是不错的,我们整体安装试试。
2. 安装
首先查看自己的python、torch和torchvision的版本,要求:python>=3.10, torch>=2.3.1 ,torchvision>=0.18.1,可以用如下脚本进行检查:
import sys
import torch
import torchvision
# 检查 Python 版本
print("Python version:", sys.version)
# 检查 PyTorch 版本
print("PyTorch version:", torch.__version__)
# 检查 torchvision 版本
print("torchvision version:", torchvision.__version__)
先不安装,直接测试
3. 实际测试
直接可以在官网测试:
https://sam2.metademolab.com/demo本文发布于2024年11月25日20:13,已经过了552天,若内容或图片失效,请留言反馈 -
01 基础大模型调用
1 背景 本节课只解决一个问题:怎么用最简单的代码调用一次大模型。 先不要急着学 CoT、ReAct、工具调用、记忆、多 Agent。因为这些能力最后都会回到同一个基础动作: text 把问题发给大模...
2026/05/24
-
提示词维度测试仪
提示词维度测试仪 背景 当我们使用大模型对ASR(语音识别)文本进行总结时,如何判断总结质量的好坏?这里提供一个简单的测试框架。 核心测试维度 1. 完整性 ✅ > 原文的关键信息是否都被覆盖? | ...
2025/11/27
-
提示词写作指南:那些我反复回看的优质示例
Geminsi 3 提示词工程:通用最佳实践指南 Gemini 3 提示词工程:通用最佳实践指南 @_philschmid 最新博客:Gemini 3 更偏好直接、逻辑性强的内容,而非冗长的说教。提示...
2025/11/26
-
提示词机理档案
模型内部是「方向」而不是「句子」 比如当我们约束“永远不要高度浓缩!”。 - 它不是直接理解「永远不要高度浓缩!」这 9 个汉字。 - 它理解的是:在训练语料中,「不要高度浓缩」「详细展开讲」「拆开来...
2025/11/27
求索空间
apostle9891
360视觉云
360智慧生活
gitea
导航
hoppscotch
暂无评论