开源模型
Step1X-Edit,阶跃星辰开源的图像编辑的实用框架,类似于GPT-4o、Gemini、豆包的图片编辑功能
Step1X-Edit,阶跃星辰开源的图像编辑的实用框架,类似于GPT-4o、G...
Kimi-Audio,Kimi开源的音频基础模型,通用音频基础模型处理各种任务,如语音识别、音频理解、音频到文本聊天、语音到语音对话
Kimi-Audio,Kimi开源的音频基础模型,通用音频基础模型处理各种任务,...
Flex.2-preview,开源的文本到图像模型,同时将文本到图像、通用控制(线条、姿势、深度)和修复都整合到一个模型中
Flex.2-preview,开源的文本到图像模型,同时将文本到图像、通用控制(...
Dia,开源的文本转语音模型,可以调节音频的输出,从而启用情感和语气控制,可以产生非语言交流,如笑声、咳嗽、清嗓子等
Dia,开源的文本转语音模型,可以调节音频的输出,从而启用情感和语气控制,可以产...