首页 > AIGC > 人工智能语言模型是什么-7. ChatGPT 等大型模型如何工作?
2023
12-26

人工智能语言模型是什么-7. ChatGPT 等大型模型如何工作?

昨天有读者给我发私信。 您能解释一下 AIGC 和 ChatGPT 之间的关系吗?

确实,短短6个月的时间ip形象,AIGC、ChatGPT、大模型等新术语突然成为媒体热词。 再加上所谓“人工智能将取代你的工作”的焦虑,张东伟觉得有必要写这样一篇科普文章。

本文将力求简化解释这波人工智能浪潮带来的新词汇及其含义,帮助大家一文了解什么是AIGC、ChatGPT、大模型。

1.什么是人工智能

AI,人工智能的英文缩写。

人工智能是研究、开发模拟、延伸和拓展人的智能的理论、方法、技术和应用系统的一门新技术科学。

人工智能是计算机科学的一个分支,它试图理解智能的本质,并产生一种能够以类似于人类智能的方式做出反应的新型智能机器。 该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

工厂的自动化生产线、小米的“铁蛋”机器狗、火车站的人脸识别通道、科大讯飞的语音输入法,都是AI系统的应用。

2. 什么是AIGC?

AIGC,全称是“AI Generation Content”,中文直译是“人工智能生成的内容”,也可以称为“生成式人工智能”(Generative AI)。 比如AI文字续写、文字转图像的AI绘图、AI数字主机等都属于AIGC的范畴。

3、什么是大模型?

首先解释一下,什么是GPT。

GPT的全称是Generative Pre-Trained Transformer,它是一种基于互联网的深度学习模型,可以用数据进行训练并生成文本。

GPT 是 AIGC 的一种。

在ChatGPT之前,引起公众关注的AI模型都是用于单一任务。 例如,全球知名的“AlphaGo”,根据全球围棋记录计算,可以击败所有人类围棋大师。 谷歌进一步开发的“AlphaZero”在围棋、国际象棋、日本象棋等项目中所向披靡。

这种专注于特定任务的AI数据模型被称为“小模型”。

ChatGPT 与这个“小模型”不同。 大的GPT模型更像人脑。 它兼具“大规模”和“预训练”属性,可以在海量通用数据上进行预训练,可以极大提高人工智能的泛化性、通用性、实用性。

基于GPT机制建立的AI数据模型被称为“大模型”。

4. 什么是ChatGPT

ChatGPT是美国OpenAI公司发布的大型模型。

由于ChatGPT 3.5展示了超出现实预期的智能数据能力,引发了一场新的全球人工智能竞赛。 2023年3月人工智能语言模型是什么,ChatGPT-4进一步提升了AI的能力。

5. 中国有ChatGPT吗?

首先人工智能语言模型是什么,我想再次强调,ChatGPT特指美国公司OpenAI的大型模型。 这是一个产品名称。

然而,主导产品往往成为行业的代名词。 例如,当我们搜索时,我们只需说“百度”。 但其实还有360、Bing、Google等其他搜索引擎。

目前,我们暂时将类似于ChatGPT的产品称为“ChatGPT-like”产品或直接称为“大模型”产品。

ChatGPT火爆后,中国科技公司也“跟上潮流”,推出了自己的大型号产品。 以下是《中国企业家》杂志整理的一些知名企业的产品清单。

然而,这种复杂的技术模型显然不可能一蹴而就。 国内不少大型车型曾被国外技术人员质疑为利用ChatGPT对其进行“脱壳”,以提升品牌形象和股价。

中国的GPT大模型的成熟还需要更多的时间和机遇,本文稍后会对此进行阐述。

6.ChatGPT有什么用?

ChatGPT 是一个复杂的系统,可以生成文本、图像和其他内容。

OpenAI的战略合作伙伴微软已将该技术添加到其Office MS 365办公套件和搜索引擎Bing等产品中。

微软的竞争对手谷歌也推出了类似的搜索工具Bard。

ChatGPT可以进行从历史到哲学的话题对话,生成不同风格的文案、文章、歌词、诗歌,甚至可以直接生成计算机代码,或者为现有计算机程序代码提供修改建议。 ChatGPT 还可以处理视觉信息,例如回答有关照片内容的问题。

ChatGPT 接受了从互联网上抓取的大量文章、图像、网站和社交媒体内容以及与 OpenAI 员工的实时对话(主要是英语)的训练。 事实上,早在2014年,微软就在中国推出了AI聊天机器人小冰。 目前尚不清楚小冰的对话内容是否也是ChatGPT学习的数据源之一。

ChatGPT 学习模仿写作的语法和结构,并输出常见的表达方式。 它还学习识别图像中的形状和图案,例如猫、孩子或衬衫的轮廓。 它还可以将单词和短语与这些形状和图案相匹配,允许用户询问图像的内容,例如猫在做什么或衬衫是什么颜色。

因为ChatGPT的原始数据来自公共互联网,而互联网上的信息并不总是准确的。 因此,ChatGPT给出的答案结果未经事实核查,不能100%保证准确。 其中一些甚至是“严重的废话”。

ChatGPT 依靠人类员工的反馈来提高准确性。

其他类似的大型模型也是如此,需要大量的手动能力来帮助大型模型提高精度。 这与中国的情况类似。 虽然大家都认为高德地图、百度地图、腾讯地图很聪明,但实际上,他们不仅仅是在调用卫星数据、交通部门数据,还有数以万计的人工“标记”在进行帮助和辅助数据修正工作。

7. ChatGPT 等大型模型如何工作?

前面提到,GPT 的意思是“Generative Pre-trained Transformer”,是大型模型的核心技术。

转换器是一种专门的算法,可以在数据序列中查找远程模式。 转换器不仅可以学习预测句子中的下一个单词,还可以学习预测段落中的下一个句子和文章中的下一个段落。 这就是为什么它在长文本中始终停留在主题上。

由于转换器需要大量数据,因此其训练分为两个阶段:首先,使用通用数据进行预训练,更容易大量收集; 然后,它根据要执行的特定任务重用定制数据。 进行微调。

张东伟在最近的两篇文章中多次强调,大模型的核心取决于三个因素:数据、算力和场景。

所有大型模型都受制于公司能够合法获取的数据量,以及支持数据的计算能力。 最后,需要有一个可以商业化的场景,形成投资产出正循环。

8.像ChatGPT这样的大型模型需要收费吗?

目前包括美国的ChatGPT以及国内的各种大型机型,都是免费的。 个人需前往官方网站注册并申请。

大型模型产品将提供API(应用程序编程接口),允许企业将技术集成到自己的产品或后端解决方案中。 这个针对企业的定制版本以及针对个人的高级版本都是收费的。

需要再次提醒大家的是,如上所述,大模型仍然需要手动优化。 因此,你在大模型中输入的内容以及大模型为你输出的答案结果都会被开发公司读取到。 。

因此,请不要输入私人数据或敏感的公司信息。

9. 政府对AIGC的态度

世界各国政府正在探索监管人工智能生成工具的方法,担心它们可能被滥用于犯罪、传播虚假信息或威胁国家安全。

4月11日,国家互联网信息办公室(以下简称国家网信办)发布《生成人工智能服务管理规定(征求意见稿)》向社会公开征求意见的通知。 反馈截止日期为5月10日。

国家网信办表示,“国家支持人工智能算法、框架等基础技术的自主创新、推广应用和国际合作,鼓励优先使用安全可信的软件、工具、计算和数据资源。 ”

国家网信办介绍,所谓“生成式人工智能”,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。 国家网信办明确,在中华人民共和国境内开发利用生成式人工智能产品为公众提供服务的,适用本办法。

在服务提供者准入资质方面,《征求意见稿》要求,使用生成式人工智能产品向社会公众提供服务前,应当遵循《具有舆情属性或者社会属性的互联网信息服务安全评估规定》。 《动员能力》(2018年11月)(2021年12月发布),向国家网信部门申请安全评估吉祥物,按照《互联网信息服务算法推荐管理规定》办理算法登记、变更、注销登记手续》(2021 年 12 月发布)。

《征求意见稿》对生成式人工智能产品或服务的提供、生成式人工智能产品的预训练和优化训练数据提出了详细要求。

10.人工智能会抢走人类的工作吗?

任何新发明的技术都会对当前的职位和未来的工作产生重大影响。

在之前的计算机、互联网、移动互联网的技术浪潮中,城市蓝领工人产生了重大影响。

业内普遍认为AIGC将对白领职业产生较大影响。

然而,回顾过去,我们会发现,计算机、互联网、移动互联网三大革命性新技术让社会经济更加充满活力。

这是因为经济学家发现,新技术的影响往往包括三个方面:

(1)部分工人生产率提高;

(2)部分职位被自动化或合并;

(3)创造以前不存在的新就业岗位。

由于新岗位的生产效率优于被替代岗位的生产效率,所以整个社会的生产效率实际上得到了提高。

但说到具体的个人,我只能说:

“那些先掌握人工智能的人将比那些后来掌握人工智能的人拥有竞争优势。”

这句话在计算机、互联网、移动互联网的早期也是同样的道理。

如果你也想尽快掌握AI技术,请关注我。

作者:张东伟(资深互联网人、营销专家、大学生就业创业导师)

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计