实测!讯飞星火与文心一言图文生成谁更强?设计师们暂时无需太担心失业

①在《科创板日报》记者实测中,讯飞星火的画风相对偏于“古典”与“写实”,文心一言作画则更显“卡通”与“抽象”特色。② 讯飞星火还开放了图生文的“识图”功能;文心一言目前似乎尚未开放识图功能,PC端没有相应选项。

讯飞星火认知大模型昨日升级2.0版本,重点增加了代码能力和多模态能力。

科大讯飞董事长刘庆峰在会上表示,今年10月24日将全面对标ChatGPT,中文超越、英文相当,明年对标GPT-4。

《科创板日报》第一时间对讯飞星火的图文生成能力进行了测试,并与文心一言进行对比。

▍讯飞星火VS文心一言:图文生成能力大比拼

讯飞星火认知大模型V2.0的一大特点是升级了多模态能力。相比之前的版本只能进行文字对话,2.0版本可对图像内容进行文字描述和理解,并生成图片。

《科创板日报》记者对升级后的讯飞星火作图能力进行了测试。

先来个简单的:画一幅风景画

讯飞星火:

记者想测试一下讯飞星火的连续对话内容,于是让其在画中增加一个4岁女孩。

结果,讯飞星火增加了三个小女孩,同时画面背景也有所变化。

文心一言:

在画中增加一个4岁女孩

文心一言在数量上没有犯错,增加了一个小女孩。不过,图片背景已完全换成了不同的另一张图。看来要让AI听从指令来作画依然存在难度,设计师们暂时无需太担心失业。

提问:画一张车水马龙的图

讯飞星火

讯飞星火给了一张古代城市的马车街道图片。于是,《科创板日报》记者让其调整为现代城市。

文心一言:

提问:画一张红烧狮子头

讯飞星火:

文心一言:

提问:画一幅画,妈妈抱着宝宝、宝宝在哭泣,宝宝6个月左右

讯飞星火:

文心一言:

从两者的回答来看,生成的图片都较为准确地完成了任务。

提问:画一个胸有成竹的男人

讯飞星火:

记者再次尝试让讯飞星火在图片中增加新内容:为画里的男人手里增加一支烟。但以失败告终。

文心一言:

文心一言倒是理解了指令,画了一个手里有烟的男性。但并非基于之前生成的图片。

提问:生成一张云计算的配图

讯飞星火:

文心一言:

提问:生成一张大数据配图

讯飞星火

文心一言:

在云计算的配图方面,文心一言更胜一筹。而大数据的配图,两者均并未准确理解文字含义。

发布会上,主持人把现场照片抛给星火V2.0识别,并令其作出文案描述。

《科创板日报》记者也上传了一张发布会的照片,对其进行了测试

讯飞星火准确地描述了图片的场景,并识别出了部分文字。值得一提的是这些文字都可以直接让AI进行朗读,变成一段音频。

而文心一言似乎尚未开放识图功能,PC端没有相应选项。手机端虽然能上传图片,但从回答来看,属于一本正经地胡说八道。

基于多模态能力升级,科大讯飞同时发布“讯飞智作2.0”工具。这一工具能进行视频分析,写文案、进行AI配音,提供配图生成、AI主播功能。在演示中,讯飞智作2.0为一段视频配上了字幕、并生成虚拟主播以及语音配音。

值得一提的是,会上讯飞星火和华为昇腾联合发布了星火一体机,该设备可提供对话开发、任务编排、插件执行、知识接入、提示工程等5种定制优化模式,以及办公、代码、客服、运维、营销、采购等10种以上即开即用的场景包,支持3种模型尺寸供用户选择

刘庆峰表示,有了这些能力,就可以使得每一家企业、每一个行业、每一个学校、每个医院都有机会构建自己的专属大模型。目前,讯飞星火已完成的在金融、政务、汽车等领域的9个专属大模型的数据显示,在场景任务优化和私域知识增强等方面平均效果能够提升20%。

(文章来源:财联社)


本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sysxhz@126.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.sysxhz.com/a/611877.html
特斯拉Model 3降至历史低价 改款或半月内上市!门店已开始接受预定
« 上一篇 2023-08-16
FED“鹰风”再来袭!卡什卡利:通胀还太高 加息应未完
下一篇 » 2023-08-16

相关文章