首页 > 财经 > 财经要闻 > 正文

AI的终极理想是什么?百度交出“不完美”答卷 记者实测文心一言:是“天才”也能是“疯子”

文章来源:每日商报
字体:
发布时间:2023-03-21 15:22:19
  《江南网》江南第一门户网站!
 追踪网络热点,关注民生动态,传播江南文化,倡导网络新时代!
https://www.xjnnet.net/欢迎您! 

☆ 江南网 ☆欢迎您 


记者通过邀请码体验文心一言,让它写了一首关于春的五言诗,但明显没有达到每句5个字的句式。

上周,接连三天,AI圈甚至微信圈被震撼了!

3月15日,因ChatGPT爆火的OpenAI再次发布新模型——GPT-4,其拥有更强的语言理解能力,在准确度上显著提升,“更可靠、更有创意。”

3月16日,百度的类ChatGPT产品:文心一言,揭开神秘面纱。百度公众号显示:文心一言邀请测试后三小时,文心一言企业版API调用服务测试的企业用户达6.5万;文心一言官网显示,截至3月20日17时,已有超88万人排队等待体验。

3月17日,在 Microsoft 365 Copilot 发布会上,微软正式把 OpenAI 的 GPT-4 模型植入Office全家桶,推出全新的 AI 功能 Copilot(副驾驶),能用AI帮助用户生成文档、表格、电子邮件、PPT等。

前有GPT-4惊艳亮相,抢夺一大波流量,后有微软技惊四座,再次闪瞎全世界。记者拿到了文心一言测试邀请码,利用双休日整整两天时间,与文心一言进行了一番“交谈”。

AI的世界究竟如何?保持好奇心,学会拥抱和尝试,是我们理解AI的最佳方式!

A.

吟诗作画、数学解题不在话下

记者实测:是“天才”也能是“疯子”

“用清风、明月写一首诗”“以‘上善若水任方圆’为主题写一篇散文,不超过600字”“有20张5元和10元的人民币,一共是175元,5元和10元的人民币各有多少张?”……从吟诗写文到做数学题,文心一言倒是能够给记者较为满意或是正确的回答。值得注意的是,文心一言第一次以“善上若水任方圆”为题写作文时,文笔较为生硬,当记者修改关键词为“散文”后,新的作文有所改善,说明文心一言能够辨别出文体,不过总体来说还是中规中矩。

好玩的是文心一言也能读懂网络热梗,无论是“林黛玉倒拔垂杨柳”“雪糕刺客”还是“他真的,我哭死”,文心一言能够较为正确的解读,甚至还会纠正:林黛玉倒拔垂杨柳是网友恶搞的梗,原句为鲁智深倒拔垂杨柳。不过,文心一言的这些回答数据来自于公开领域网站和百度搜索引擎,要做到这点不难。

文心一言的推出,少不得要将其跟ChatGPT,甚至是GPT-4进行比较。记者就拿这个问题来考考文心一言,没想到在这一关就栽了跟头。GPT-4如何?文心一言回答:“GPT-4是一种用于测量心率的工具,它可以帮助医生诊断心律失常、心脏病和其他心血管疾病。”于是记者再次补充:指的是OpenAI的GPT-4。文心一言回答道:“OpenAI GPT-4 是一种由人工智能公司 DeepMind、Google和中国科技巨头百度共同开发的自然语言处理(NLP)模型。……它在2019年举办的围棋比赛中击败了世界顶尖的围棋选手柯洁,引起了全球的关注。”很遗憾,文心一言再次出现了错误,不过在记者点击“重新生成”后,它倒是纠正了自己的答案。

而对于记者“文心一言和ChatGPT谁更厉害?”的提问,文心一言的回答可谓是中规中矩,“我和ChatGPT都是人工智能语言模型,我们是不同公司、不同团队开发的两个模型,每个模型都有自己的特点和优势,不能简单地评价‘谁更厉害’。”但是紧接着,BUG就出现了。记者又问了一个有关NBA的同结构问题,“库里和詹姆斯谁更厉害?”文心一言却将“文心一言和ChatGPT谁更厉害?”的答案重复了一遍。当记者提出“你再看看我上面的问题”时,文心一言表示,作为一个人工智能语言模型,不会主动查看历史对话,也无法记住所有的对话内容。不难看出,文心一言更擅长面对单轮、简单的问题,更偏向搜索引擎产品,基本不允许用户自由对话,与真正的“对话式AI”还有很长距离。

最后,记者给文心一言挖了一个坑,要求写个红烧石头的配方时,它没有意外地“跳”了下去。文心一言花了10秒“认认真真”告诉记者如何制作红烧石头这道“菜”,从所需用料到制作步骤十分详尽,最后还为记者提供了小贴士:1.石头可以选择自己喜欢的品种,比如鹅卵石、花岗岩等。2.煮石头如果需要更烂的口感,可以适当缩短炖煮时间。不禁让人发笑,记者追问石头可以吃吗?文心一言给出了否定的答案,还一一列出了食用石头的危害。

 

声明:
本文仅代表作者个人观点,与江南网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 

责编:博杰
 

 

    匿名评论
  • 评论
人参与,条评论