视频理解
Vidi,字节跳动推出的视频理解和编辑的大型多模态模型
Github地址:https://github.com/bytedance/vidi
详细与演示:https://www.52wts.cn/7264.html
VideoLLaMA3,阿里巴巴开源的多模态基础模型,具备前沿图像和视频理解能力
Github地址:https://github.com/DAMO-NLP-SG/VideoLLaMA3
详细与演示:https://www.52wts.cn/5644.html
Qwen2-VL,基于 Qwen2 打造,参数有72B、7B、2B三种,能理解超20分钟视频,媲美GPT-4o
Github地址:https://github.com/QwenLM/Qwen2.5-VL
详细与演示:https://www.52wts.cn/3041.html
VideoMind,用于长视频推理的 Chain-of-LoRA 代理
Github地址:https://github.com/yeliudev/VideoMind
详细与演示:https://www.52wts.cn/6713.html
视频编辑
VACE,阿里开源的视频创建和编辑工具,支持参考视频生成、视频到视频编辑和蒙版视频到视频编辑
Github地址:https://github.com/ali-vilab/VACE
详细与演示:https://www.52wts.cn/6319.html
视频变清晰
Ev-DeblurVSR,可以提升视频清晰度,也可以消除视频模糊
Github地址:https://github.com/DachunKai/Ev-DeblurVSR
详细与演示:https://www.52wts.cn/7352.html
微信扫描下方的二维码阅读本文
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)