视频理解

Vidi,字节跳动推出的视频理解和编辑的大型多模态模型

Github地址:https://github.com/bytedance/vidi

详细与演示:https://www.52wts.cn/7264.html

VideoLLaMA3,阿里巴巴开源的多模态基础模型,具备前沿图像和视频理解能力

Github地址:https://github.com/DAMO-NLP-SG/VideoLLaMA3

详细与演示:https://www.52wts.cn/5644.html

Qwen2-VL,基于 Qwen2 打造,参数有72B、7B、2B三种,能理解超20分钟视频,媲美GPT-4o

Github地址:https://github.com/QwenLM/Qwen2.5-VL

详细与演示:https://www.52wts.cn/3041.html

VideoMind,用于长视频推理的 Chain-of-LoRA 代理

Github地址:https://github.com/yeliudev/VideoMind

详细与演示:https://www.52wts.cn/6713.html

视频编辑

VACE,阿里开源的视频创建和编辑工具,支持参考视频生成、视频到视频编辑和蒙版视频到视频编辑

Github地址:https://github.com/ali-vilab/VACE

详细与演示:https://www.52wts.cn/6319.html

视频变清晰

Ev-DeblurVSR,可以提升视频清晰度,也可以消除视频模糊

Github地址:https://github.com/DachunKai/Ev-DeblurVSR

详细与演示:https://www.52wts.cn/7352.html



微信扫描下方的二维码阅读本文

开源视频理解,视频编辑,视频变清晰系列,开源视频项目系列插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。