前几天从五个方向测评了文心一言,豆包,腾讯元宝,今天我们再从AI绘画,AI搜索,数学推理,编程代码,图片分析,文档总结分析六个方向测评通义千问,讯飞星火,Kimi三大语言大模型,看看到底谁强谁弱?让我们拭目以待吧!!!
AI绘画
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图](https://img.52wts.cn/wp-content/uploads/2024/06/0969fa370582224.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图1 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图1](https://img.52wts.cn/wp-content/uploads/2024/06/33b57bc4d0ba0ce.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图2 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图2](https://img.52wts.cn/wp-content/uploads/2024/06/3ac029012adf489.png)
通义千问画上的风景比较丰富,有山有水有房屋,简单的描述勾勒出的风景图也算不错的咯~
讯飞星火总体感觉比通义千问绘画功底也逊色点,图片总体来说有点模糊,对关键词的理解有偏差。
Kimi纯纯的语言大模型,并没有AI绘画功能,虽然给出了绘画建议,但还是有点落伍了吧!现在基本市面上都支持AI绘画。
AI绘画方面还是通义千问拔得头筹,讯飞星火还有待提高,Kimi则是完全不支持,可能方面并不在此,所以并不打算涉及。
AI搜索
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图3 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图3](https://img.52wts.cn/wp-content/uploads/2024/06/6ceb72644581da4.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图4 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图4](https://img.52wts.cn/wp-content/uploads/2024/06/cb4cd55dd7560b6.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图5 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图5](https://img.52wts.cn/wp-content/uploads/2024/06/88e1938d7b9269d.png)
通义千问的AI搜索功能并没有作出总结,只是搜索出来了今日的AI事件,想了解详细的还是需要点击进入原网址查看,只能说AI搜索总结功能做的并不完善。
讯飞星火给出了事件观点,但我要的是今日AI事件,并没有完全理解我想要的是什么?AI搜索功能也只能称之为鸡肋。
Kimi与讯飞星火一样,只是给出了事件观点,并没有理解我想要的是什么?
通义千问,讯飞星火,Kimi的AI搜索功能与文心一言和腾讯元宝进行对比的话,相差太多,虽然说名义上支持AI搜索功能,但是真正使用起来太过于鸡肋。
数学推理
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图6 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图6](https://img.52wts.cn/wp-content/uploads/2024/06/05b3a69c73e2bd7.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图7 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图7](https://img.52wts.cn/wp-content/uploads/2024/06/874261fdb03afc7.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图8 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图8](https://img.52wts.cn/wp-content/uploads/2024/06/3e8530832124802.png)
通义千问够直接的,直接说题目有误,还义正言辞的说哪里有错误,我直接一脸懵,其他AI都能解析出答案,到通义千问就题目有误,直接来个大差评。
讯飞星火给出了正确答案,但是并没给出详细的解题思路,马马虎虎过关吧!
Kimi则是胡乱解答,答案完全是错的,哦不,这数学推理能力真的就这么差么?
不得不说数学推理能力只有讯飞星火马马虎虎通关咯~属实是有点无奈,这道题按理说应该都能解答出来才是,难道是有用了假产品。
编程代码
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图9 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图9](https://img.52wts.cn/wp-content/uploads/2024/06/9f9fa7af30666f5.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图10 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图10](https://img.52wts.cn/wp-content/uploads/2024/06/df3a40373d6f736.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图11 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图11](https://img.52wts.cn/wp-content/uploads/2024/06/1c9badcb65e3363.png)
通义千问很快的写出了抓取网站数据的代码,还提醒了要安全合规的使用。
讯飞星火同样也写出来了代码,真的是不愿意多说一句话,回答都是完完全全的代码。
Kimi也是一样写出了代码,并没有多大的出入。
编程代码这方面通义千问,讯飞星火,Kimi应该算是不相上下,都是完整的写出了示例代码。
图片分析
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图12 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图12](https://img.52wts.cn/wp-content/uploads/2024/06/de296fc5838fd18.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图13 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图13](https://img.52wts.cn/wp-content/uploads/2024/06/de930c221e1e652.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图14 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图14](https://img.52wts.cn/wp-content/uploads/2024/06/1ebbbedbee9aa03.png)
通义千问并不能识别AI绘画的图片,想要问的图片含义回答的也是模棱两可。
讯飞星火则说不是AI生成的,错误,这是用Stable Diffusion生成的,图片的含义总体说的不错。
Kimi直接说图片属于异常文件,连提问的机会都没给,我就不服气了,图片怎么就成异常文件咯~
不难看出讯飞星火的图片分析能力拔得头筹,Kimi算是比较离谱的,直接拒绝问答。
文档总结分析
通义千问
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图15 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图15](https://img.52wts.cn/wp-content/uploads/2024/06/86bd2e210ce612b.png)
讯飞星火
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图16 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图16](https://img.52wts.cn/wp-content/uploads/2024/06/48d1e2855179eaa.png)
Kimi
![通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图17 通义千问vs讯飞星火vsKimi,到底谁强谁弱?插图17](https://img.52wts.cn/wp-content/uploads/2024/06/7d8b564fcb26f09.png)
通义千问对PDF文件是关键点解析,用123和标记看得更加明朗,一目了然。
讯飞星火也成功分析出PDF的关键内容,需要逐字看才能看的仔细。
Kimi对PDF文件的分析可以说更加仔细,内容总结的也比较完善。
总体来说通义千问,讯飞星火,Kimi各有各的优势,并不能完全去评判谁强谁弱。
微信扫描下方的二维码阅读本文
评论(0)