作者 赵翔 蒋瑞英
编辑 秦拓
近期,关于文馨“恶作剧”的争议愈演愈烈。
一位业内人士向橡果商业评论表示,所谓“哄”应该是指文心一言通过中英翻译应用开源模型、使用开源数据进行训练的行为。
根据百度发布的相关论文,闻心一言的“闻声图”功能在训练时使用百度翻译进行中英翻译。
事实上,百度翻译在行业中早已落后,其机器翻译性能远远落后于其他人工智能公司。
《橡果商业评论》将百度翻译与科大讯飞翻译、腾讯翻译、网易翻译进行对比,发现百度翻译的名词短语翻译存在一词多义、歧义等问题。
上述业内人士表示:
如果翻译错误,也会直接影响生成模型的效果。
但翻译是中国人工智能的必由之路。
截至2021年,全球排名前1000万的网站中,英文内容占60.4%,中文内容仅占1.4%。
中国的AI需要依赖大量的英文数据集进行训练。
翻译成为了温心一言面前的一座“大山”。
面对技术问题,百度不仅从未正面回应吉祥物,还不断公开强调“国产”需要时间。
这样的说法,似乎是为了维护李彦宏作为“优秀中国学生”的自尊。
温心一言陷入中英翻译的困境。 中国人工智能的未来在哪里?
1:文馨的“恶作剧”言论可疑,但自画像却是“白人男性”?
3月22日,博主刘大可先生爆料文馨“阴谋、作画、诈骗”。
@李大克先生说,如果用文心一言来制作图片,它会将中文翻译成英文,然后使用国外开源的AI文胜图模型Stable Diffusion生成图片。
Stable Diffusion 与 OpenAI 的 Dall-E 2 类似。它们都是 AI Vincent 图模型,由英国公司 Stability AI 于 2022 年 8 月发布。
以“一罐豆”为例。 这句话不是完整的汉语; 如果用“百度翻译”直接翻译成英文,结果就是“One can beans”。
“可以”译为“可以”。 根据上下文,“can”被理解为量词,整个句子的意思是“一罐豆子”。
因此,如果让文馨说出“一罐豆子”来画一幅画,就会得到“一罐豆子”的图画。
这不是一个孤立的案例:
1.使用“百度翻译”搜索“牛肉罐头”,您会得到“牛肉罐头”;
2.“A冰箱罐头”的意思是“冰箱罐头”。
3、“Milk Road”对应翻译“牛奶路”;
相应地,闻心一言还会生成“一罐牛肉”、“满是罐头的冰箱”和“银河”的图片。
除了“直译”造成的错误外,多重含义的词语也会让文心一言的画“瞎”:
1、“鹤”在百度翻译中就是“鹤”;
2.“Türkiye”的意思是“土耳其”。
“鹤”更常见的意思是“鹤”,“火鸡”也有“火鸡”的意思,所以文馨的话会生成“鹤头”和“火鸡”的图片。
另外,如果要求文馨生成一幅“肖像”而不添加关键字“中国人”,则所有画作都将是“白人”。
3月16日,《橡果商业评论》要求文心怡妍画一幅“自画像”,但她得到的却是一张“白人男性”的照片。
3月23日,百度发布声明,表示“不传谣、不相信谣言”。 文心一言的“文升图”能力来自于文心的跨模态大模型ERNIE-ViLG。
2:“猪队友”百度翻译,让文心一言卷入“诈骗”风波
温心一言却有不同的答案。
3月23日,据《澎湃新闻》报道,在与文心一言对话并询问是否使用Stable Diffusion时,文心一言不仅承认使用了Stable Diffusion吉祥物,还承认使用了Transformer、GRU等深度学习模型来生成图像。 。
其实,这并不意味着文心一言的《文圣图》有所谓的“作弊”。
据百度官方介绍,文心一言的“文声图”功能来自ERNIE-ViLG 2.0。
根据百度发表的论文《ERNIE-ViLG 2.0:利用知识增强的混合去噪专家改进文本到图像的扩散模型》,ERNIE-ViLG 2.0的训练数据由1.7亿个图像文本对组成,包括互联网公开的英文数据集和百度内部中文数据集。
然而,在ERNIE-ViLG 2.0训练阶段,训练数据中的一些中英文翻译是由百度翻译自动翻译的。
业内人士唐哲(化名)向橡果商业评论表示,百度翻译已经落后,机器翻译性能与其他人工智能公司相比存在较大差距。
特别是名词短语翻译存在一词多义、歧义等问题。 如果翻译错误,将直接影响生成模型的结果。
以上面的“牛肉没问题”为例。
《橡果商业评论》使用百度将结果翻译为“Beef can”(牛肉罐头); 腾讯将其翻译为“Beef is Fine”(牛肉很好); 网易将其翻译为“Beef can”(牛肉罐头); 科大讯飞将结果翻译为“Beef is OK”(牛肉很好)。
在不同的翻译软件中,只有腾讯翻译和讯飞翻译回答正确。
唐哲举了最近最流行的“硬头硬脑胖子”的例子。
百度翻译为“虎头虎脑的大胖子”,网易翻译、腾讯翻译也类似。
科大讯飞的翻译结果比较接近,是“虎头胖子”;
唐哲解释说,温心一言的绘画能力强调的是输入文本内容的实体信息。 例如“虎头虎头的胖子”就会把“虎头”当成一个单独的实体。
这不仅忽略了整体句子层面的语义理解,也与温心一言发布时提到的“汉语理解能力强”完全不符。
三:“差生”冒充“优等生”,李彦宏的自尊游戏?
在3月16日的文心一言发布会上,百度CEO李彦宏用预先录制的文心一言演示视频讲解了其中文理解能力。
例如,文心一言提出“洛阳纸贵”、“藏头诗”等问题。
最后,李彦宏总结道,文心一言是一个扎根中国市场、拥有中文领域最先进的自然语言处理能力的大型语言模型。
目前看来百度ai搜索与文心一言的区别,温馨的话与李彦宏口中的“中国优等生”相差甚远。
唐哲认为,百度采用的是中英翻译的方式。 无论是应用开源模型,还是利用开源数据参加训练,都应该更加注重中文理解和中英翻译。
遗憾的是,温心一言的技术出现了问题。 面对质疑,百度并未对这一问题给出公开专业的答复。
还以“需要时间学习和成长”、“给自主研发产品信息时间”为借口,消耗国内用户的耐心和信心。
另一方面,当温心一言的答案被指出有问题时,答案就会“消失”。
3月23日下午,《橡子商业评论》使用文心一言发现,文心一言对类似“牛肉还可以”的“XX可以”问题的回答被“屏蔽”。
直到那天晚上,答案才再次回来。 面对“牛肉还可以”的指令,温心说的不再是“牛肉罐头”,而是“一盘牛肉”。
这似乎是一次“升级迭代”?
但如果继续问“牛奶路”,生成的图片仍然是“银河系”。
这个操作并不像百度所说的“学习能力提升”,而更像是真人进行的屏蔽和修正。
即便如此,李彦宏在接受媒体专访时也相信,两个月后文心一言就能赶上今年1月的ChatGPT。
唐哲认为,从用户角度来看,闻心一言和ChatGPT有很大差距。
ChatGPT基本可以满足用户的需求。 另一方面,文心一言已经“失去”了绘画能力和理解能力。 “从抽奖结果来看,《文心一言》更适合玩看图猜成语的游戏。”
四:温心一言陷入汉英翻译困境。 ChatGPT在中国很难吗?
闻心一言 离 ChatGPT有多远?
唐哲认为,文心一言在问答、词典、文献检索等方面基本都通过了考验,这是为了利用百度自己的搜索引擎。
但在数学、编码、归纳推理、翻译等方面,却被ChatGPT抛在了后面。
唐哲多次询问中国独特的农历。 尽管百度多次修改文心一言,文心一言仍然没有给出正确答案。
对于一些常见的亲属关系和推理选择,闻心一言所表现出来的推理逻辑看似很有道理,但实际上却是严重的无稽之谈。
唐哲总结道:
1.《文心易言》在汉语写作和语法分析方面的分析精度和准确度不高;
2、虽然会有文本生成、重写、合成等基本的格式框架,但内容无法仔细阅读,而且内容不像GPT那么详细和细腻。
3、文心一言对海量信息的参数化全卷记忆题和一些复杂的逻辑思维推理题的回答大多不符合用户的初衷。
其次,温心一言对于安全敏感话题的把控非常谨慎。
唐哲表示,温馨一言的敏感词范围比较广,处理逻辑有些粗糙。
例如,如果用户A提出了包含敏感词的问题,闻心一言就会强行关闭A的对话框,以阻止A继续发帖。
在此类问题上,ChatGPT相对更客观,会增加积极的引导和安慰。
唐哲认为,上述例子说明百度内部精细化、层次化还不够,处理不灵活。
事实上,对于闻心一言来说,现阶段最重要的就是找到百度翻译的替代品。
业内人士表示,虽然简体中文网民和英文网民规模大致相当,但截至2021年,全球排名前1000万的网站中,英文内容占60.4%,中文内容仅占1.4%。
中国的AI需要依赖大量的英文数据集进行训练,否则就会吃亏。
文心一言想要成为ChatGPT的“中国版”,就需要做好中英文互译的第一步。
当文心怡说《文圣图》还在“看图猜成语”时,根据最新消息,OpenAI宣布ChatGPT支持接入第三方插件,已上线11个插件。
浏览插件支持ChatGPT实时搜索互联网内容。
未密封的 ChatGPT 将会涌现出无数的可能性。
毫无疑问,全能AI助手时代即将到来。
但时至今日百度ai搜索与文心一言的区别,中国仍被ChatGPT“封锁、锁定”。
- 本文固定链接: https://wen.nuanque.com/aigc/13277.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。