开源模型 MedGemma,基于Gemma 3 构建的医学文本和图像理解开放模型,4B 多模态版本和 27B 纯文本版本 MedGemma,基于Gemma 3 构建的医学文本和图像理解开放模型,4B 多...
开源模型 Devstral-Small-2505,Mistral AI 和 All Hands AI合作开源的软件工程任务的代理 LLM Devstral-Small-2505,Mistral AI 和 All Han...
开源模型 AgentCPM-GUI,清华大学和面壁智能开源设备端 LLM 代理模型,接受智能手机屏幕截图作为输入,并自主执行用户指定的任务 AgentCPM-GUI,清华大学和面壁智能开源设备端 LLM 代理模型,接受智...
开源模型 Stable Audio Open Small,StabilityAI开源的341M 参数的文本到音频模型,可完全在 ARM CPU 上运行 Stable Audio Open Small,StabilityAI开源的34...
开源模型 smolvlm-realtime-webcam,使用 SmolVLM 和 llama.cpp 服务器的实时网络摄像头演示 smolvlm-realtime-webcam,使用 SmolVLM 和 lla...
开源模型 FastVLM,苹果开源的可以在iphone运行的视觉语言模型,旨在输出更少的令牌并显著减少高分辨率图像的编码时间 FastVLM,苹果开源的可以在iphone运行的视觉语言模型,旨在输出更少的令...