首页 > AIGC > 中国版chatGPT百度文心一言-实测|温馨一言初体验,百度VS OpenAI,谁是你最​​好的职业助手?
2024
06-13

中国版chatGPT百度文心一言-实测|温馨一言初体验,百度VS OpenAI,谁是你最​​好的职业助手?

人工智能可以代替人类做很多重复性、规律性、简单的重复性工作,但是人工智能无法代替人类的创造力、灵活性、判断力、情感交流以及其他人际交往任务如艺术家、医生、老师等。”这段由对话式人工智能语言模型写成的文章,能缓解人类的职业焦虑吗?

自人工智能兴起以来,人工智能的能力、边界、竞争力一直是热议话题。3月16日,百度推出基于文心模型的生成式对话产品文心易言。国内用户距离实现“ChatGPT”自由又近了一步,“ChatGPT”也与用户的工作、生活有了更大的交集。人工智能会抢走人类的饭碗吗?北京商报记者以主播、记者、老师的身份中国版chatGPT百度文心一言,与ChatGPT、文心易言以及国内另一位AI模特袁成祥进行了交流。如果你对AI有疑问,何不直接问AI?

Q1:你是一个合格的主播吗?

“我可以解答你的疑问,为你提供有用的信息,帮助你完成创作。”“我可以根据输入的提示,生成文章、诗歌、小说、对话等各类文本。”既然文心怡言和ChatGPT都这样介绍自己,那么忙于各类文案工作的公众号编辑、广告设计师、直播团队的脑细胞是不是会省下来呢?带着这个问题,北京商报记者记下了如下需求:

针对上班族,为一款抗衰老霜撰写直播文案。

商报摘要:

各大模特都抓住了“职场”“抗衰老”“直播带货”等关键词,也介绍了产品,但正如袁成翔对自己的介绍,情感传播是人工智能无法胜任的工作。抛开产品本身,直播间火不火,与主播卖货的情绪、节奏有直接关系。“能识别文字表达的情绪表情包设计,并把情绪归类”,ChatGPT 自我总结道,但这并不代表它就能输出情绪。那么主播们的关注点究竟是什么呢?

交友直播间主持人王拓点评:

如果是在我们的直播间,这三个脚本都需要重写。从合规的角度来说,面霜是普通化妆品,这种保健品在直播间是不能宣传功效的。其次,脚本中不能出现大量的形容词和误导性描述,这些很容易误导消费者,侵犯消费者权益。这在直播间是严格禁止的。我认为,直播间直播不应该只追求让消费者下单,更应该科普,引导消费者正确认识和使用产品。

Q2:为孩子寻找一位好老师

在GPT-4推出之前,斯坦福大学的一项研究表明中国版chatGPT百度文心一言,ChatGPT背后的模型在心智上相当于一个9岁的孩子。GPT-4发布后,一位美国创业公司人士评价说,“GPT-3或3.5就像一个六年级学生,而GPT-4就像一个聪明的十年级学生。”其读图、考试、编程的能力也是有目共睹的。百度CEO李彦宏在演示“文心易言”时说:“文心易言已经具备了一定的思考能力。”

智商够了,输出能力呢?尤其是理解能力更弱的孩子,试想让他们给一个6岁的小孩解释牛顿第二运动定律。

商报摘要:

显然,三款大型模型都抓住了孩子们的重点,并尝试以友好的语气与用户进行互动。与解决数学问题不同,大型模型需要举例说明,并有一个框架对象。一千个人心里有一千个哈姆雷特。成人最满意的解释,在孩子心中未必是最好的。听听幼儿园老师的意见,也许能给我们新的启发。

北京美琪琪幼儿园席老师:

作为幼儿教师,在与幼儿开展科学活动时表情包设计,概念性的讲解一定要严谨、简洁、通俗易懂,我们更愿意用直观的方式给幼儿演示,更重要的是不能忽视幼儿的动手过程。

第一类:实际操作上,这一类的例子对于老师掌控课堂、讲解概念的能力是一个很大的挑战,而且孩子也很难理解。

第二种:以俏皮可爱的情境引入活动,符合幼儿发展特点。语言简洁易懂。幼儿可以按照步骤完成实验的每一步,每个知识点都可以通过自己的操作反复演示,丰富幼儿的学习体验并最终得出结论。一线教师可以轻松使用,类似教学计划也更方便。

第三种:讲解过于书面化,不适合该年龄段的孩子,无法帮助老师更好地实现课程的教学目标。

Q3:隐藏的笑话讲述者是谁?

智能音箱流行起来的时候,人们经常会拿出人类与AI助手对话的笑料。AI助手在涉及到性别、婚姻状况等隐私信息,以及有意无意的调侃时,有不少让人捧腹大笑的绝招。AI大模型会不会讲笑话?它讲的笑话好笑吗?这或许是文艺创作者们关注的重点,毕竟喜剧创作难是共识。

让大模围绕“躺下”和“翻开书”写一篇200字的脱口秀,哪一个会让你笑翻?

商报摘要:

“一头雾水,一头雾水”是记者看完三段话后的第一感觉。为了考验大模的智力水平,记者特意用“open book”代替“involve”来提问。看来大模误会了,大模写一段200字的话确实很难,这更像是名词解释。

《磁场喜剧》主持人张美男点评:

脱口秀虽然也有一些创作手法,比如反转、出乎意料、融合或者双关,但这些手法的处理因人而异,每个人的创作能力、演讲技巧以及后期个人人格的树立都与此有关。

虽然目前AI可以通过一些算法创造出一些标准化的笑话,但这些笑话大多不是源于社会现实或真实事件的二次创作,有的能让人发笑,但很难引起人们的共鸣,现场与观众的互动也是AI算法所不具备的。在个人观点的表达方面,脱口秀非常注重自我个性,观点的摩擦会产生笑点,如果通过算法把大多数人的观点合并成一个,那就没有观点了,更谈不上个人观点的表达。

找到主编和记者等优秀的队友

人工智能能取代记者吗?多年前,在一次媒体沟通会上,创新工场首席执行官李开复回答过这个问题。他的回答大致是:人工智能无法取代记者的思考。几年过去了,人工智能在新闻写作方面有什么进展吗?我们用同样的问题做一个测试来感受一下:

请以“大规模AI语言模型的兴起”为主题,撰写一篇300字的新闻评论:

商报摘要:

显然,三大模型都无视300字的限制,写了一篇长文。这次PK还曝光了大模型库的更新时间。袁成翔在文中提到的“GPT-3是最新开源AI语言模型”有事实错误。应该有更多专业评论分享给教授新闻评论课程的老师。

中国人民大学新闻学院讲师杨其光评论说:

专业的新闻评论提倡用批判性思维去分析问题,而不是仅仅描述现象。从这个评价标准来看,第二篇文章更具批判性,并给出了相应的解决方案。第一篇和第三篇文章虽然提到了大型AI模型可能带来的风险,但并未深入阐述,缺乏针对性的深度。

第一篇文章的亮点在于提到了大模型之间的竞争,这是比较新颖的做法。但从新闻评论的文本形式来看,前两篇评论一个明显的共同缺陷就是标题的缺失。标题是新闻评论核心论点的直观体现,不应省略。此外,演绎、归纳、类比、反驳等新闻评论常用的论证方法也相对缺失,段落结构的安排也有些机械。

当然,作为新闻评论员和研究者,我们对于新技术也应该抱有包容和开放的态度,如何让传统新闻业更好地与新技术互动、协同,进一步倡导科技向善的新闻生态建设,才是我们更需要深思的。

复活节彩蛋:绘画技巧比赛

以下是三大模型针对“生成‘不知谁裁出细叶,二月春风似剪刀’”这个要求给出的答案,哪个更好呢?

北京商报记者 魏炜

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计