文心一言,腾讯元宝,豆包相信大家都熟悉的不能再熟悉了,我们今天就对这三款大厂的语言大模型进行大比拼,看看谁家的更胜一筹。我们将从AI绘画,AI搜索,数学推理,编程代码,分析能力五大方向来进行测评。

AI绘画

AI绘画这三款大模型都是支持的,我们就让它们画一幅含有中国风的山水图。

文心一言

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图

腾讯元宝

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图1

豆包

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图2

从上述的反馈来看,文心一言与腾讯元宝AI绘画功能略胜一筹,豆包绘画功能则差点意思。

AI搜索

AI搜索功能对于这三款模型来说并不是难题,主要看谁家的检索能力更强,谁家的总结能力更强。既然评测的是AI,我们就搜索今日关于AI的最新事件吧!

文心一言

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图3

腾讯元宝

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图4

豆包

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图5

从上述反馈来看,文心一言是基于百度搜索检索内容并总结,腾讯元宝是基于公众号文章检索内容并总结,豆包是基于头条,微博等其它平台检索内容并总结,对于文心一言和腾讯元宝还是比豆包更有优势,都有自家的产品作为搜索底层。同时豆包搜索也出错了,OpenAI CEO 被罢免事件已经是很久之前的事件了,并不是今日事件,所以豆包的AI搜索功能并不严谨。

对于各大平台的AI搜索功能还是得有自己的分辨能力,毕竟AI并不是人,不可能做到不出错。

数学推理

数学推理应该是每款语言大模型必训练的一道门槛,我们来用大学奥数题让它们解答。

文心一言

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图6

腾讯元宝

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图7

豆包

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图8

从上述反馈来看,答案是8062,三款大模型均没有出错,但豆包只是给出了答案,并没有解题思路与公式,而文心一言,腾讯元宝都不仅得出了答案,还给出了解题公式,还是文心一言与腾讯元宝更胜一筹。

编程代码

写代码这三款大模型都会,我们来点不一样的,不仅要写代码,还要对每段代码进行注释,这样连小白都能看得懂代码不是更有意思。

文心一言

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图9

腾讯元宝

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图10

豆包

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图11

从上述反馈来看,豆包写的都不能算是代码,只能说太差劲了。真的是没有对比就没有伤害,文心一言,腾讯元宝都详细的写出了示例代码,函数调用,图片调用等,看来又是文心一言,腾讯元宝更胜一筹。

分析总结能力

分析总结能力如果只是分析文字就太简单了,我们就用PDF文件的方式,先读取内容,再进行内容的总结吧!

文心一言

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图12

腾讯元宝

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图13

豆包

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图14

从上述反馈来看,三款大模型都没有任何的出错与问题,分析总结能力都是不想上下。

文心一言,腾讯元宝,豆包作为三大科技巨头的大语言模型,豆包的能力的确略逊一筹,当然这次只是从五个方向测评,并不能完全代表豆包的能力不行。也期待国内的大模型尽快超越国外。



微信扫描下方的二维码阅读本文

文心一言vs腾讯元宝vs豆包,三款大厂语言大模型大比拼,谁家更胜一筹?插图15

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。