首页 > AIGC > aigc生成内容-AIGC,内容生成的巨大浪潮即将来临
2024
02-19

aigc生成内容-AIGC,内容生成的巨大浪潮即将来临

原创 李竹丛程远 复旦商业知识

作者:李竹聪、程远

复旦大学人工智能创新与产业研究院博士生

复旦大学人工智能创新与产业研究院研究员

人类文明可以被认为是所有人类生命印记的有记录的记录的总和。 那么,如果有一个超级大脑,能够学习人类记录的所有知识,是否能够帮助我们创造更加辉煌、丰富的文明呢?

2022年12月,被《科学》杂志评选为年度十大科学突破之一的AIGC将这一梦想变成了现实。 AIGC全称AI-Generated Content,即生成式AI,利用人工智能技术自动生成内容。 对于AIGC来说,2022年被认为是惊人发展的一年。 AIGC可以说是当今AI领域最热门、最富有想象力的发展方向。 AIGC的发展催生了写作助手、AI绘画、对话机器人、数字人、办公软件助手等热门应用,并通过人机交互形成了新的产业。 记录、学习和再创造的范式。 一个引人注目的问题出现了:AIGC将如何推动人工智能新浪潮?

英雄不一定是出身卑微的。 OpenAI的故事始于一群对人工智能未来感到恐惧的创业新贵。 GPT系列就像是OpenAI精心准备的各种饲料培育出来的超级大脑。

GPT-2模型是OpenAI成立近三年半后创建的第一个真正的杰作。 GPT-2 包含 15 亿个参数,以 800 万个 Reddit 论坛帖子和总共 40GB 的文本为数据源,显示了持续文本编写的能力。 例如,如果你输入《指环王》中的一句话,它会生成一个让人无法辨别真假的延续。 剧情与原著有所不同,但似乎合乎逻辑。

OpenAI 疯狂地想知道这个超级大脑如果能吃掉更多的语料,会拥有什么能力,于是拥有 1750 亿个参数的 GPT-3 诞生了。 仅 GPT-3 的训练成本就高达数千万美元。 专家们将过去12年来从6000万个域名中收集到的新闻报道、帖子、书籍全文以及各种网页等数千亿字的英文数据输入到模型中。 。 这次的GPT-3不仅拥有更强大的语言生成能力,还拥有出色的上下文学习能力和大量的世界知识。 擅长写诗、写新闻报道、回答问题、写代码。 最新的GPT-4具有更强的数据处理和理解能力。 它可以接收并生成 25,000 字的文本,是之前 ChatGPT 的 8 倍。

此外,其逻辑思维能力和形象理解能力也有了很大的飞跃。 OpenAI 可能是人工智能记录、学习和再创造范式最坚定的实践者。 据爱丁堡大学和艾伦人工智能研究所猜测aigc生成内容,OpenAI内部已经迭代了多个版本,从GPT-3到GPT-3.5再到GPT-4。 ChatGPT 根据人类反馈的强化学习来微调其指令。 通过显着降低其情境学习能力,它提高了四种能力:详细回答、公平回答、拒绝不恰当的问题、拒绝超出其知识范围的问题。

除了以ChatGPT为代表的语言生成技术外,AIGC还包括图像生成、视频生成、音频生成等。根据AIGC发布的《AIGC白皮书》,AIGC漫长的发展历史大致可分为以下三个阶段:中国信息通信研究院:

萌芽初期(1950年代-1990年代):受技术水平限制,AIGC仅限于小规模实验,生成的内容不太现实。 1957年,Lejaren Hiller和Leonard Isaacson通过将计算机程序中的控制变量改为音符,完成了第一部由计算机创作的音乐作品。 – 弦乐四重奏“髂组曲”。 1966年,约瑟夫·魏森鲍姆(Joseph Weizenbaum)和肯尼思·科尔比(Kenneth Colby)共同开发了世界上第一个机器人“伊丽莎”(Eliza),它利用关键词扫描和重组来完成交互任务。 20世纪80年代中期,IBM基于隐马尔可夫链模型创建了声控打字机“Tangora”,可处理2万个单词。 现阶段AIGC只是通过学习专家编写的规则来生成,其泛化能力极其有限,就像专家扮演的木偶一样。

沉淀积累阶段(1990年代-2010年代):AIGC逐渐从实验转向实用。 深度学习算法、图形处理单元(GPU)、张量处理器(TPU)和训练数据规模都取得了重大突破。 2007年,纽约大学人工智能研究员罗斯·古德温组装了一个人工智能系统,记录并感知他在公路旅行中的所见所闻,写出了世界上第一部完全由人工智能创作的小说。 小说 – 1 路。 2012年,微软公开展示了一款全自动同声传译系统,可以通过深度神经网络(DNN)通过语音识别、语言翻译、语音合成等技术,自动生成英语使用者的中文语音。 这一阶段,AIGC开始从人类记录的少量数据中自动学习,掌握了一定的泛化能力。 但受限于算法瓶颈,生成效果有待提高。 此时的AIGC就像一只善于模仿的鹦鹉。 看上去很正经,但实际上什么都不懂。

快速发展阶段(2010年代至今):2014年以来aigc生成内容,随着生成式深度学习算法的引入和训练数据规模的快速扩大,AIGC生成内容的效果逐渐变得如此逼真,以至于人类难以辨别。 2017年,微软人工智能女孩“小冰”推出了全球第一本完全由人工智能创作的诗集《阳光失去了窗户》。 2018年,NVIDIA发布的StyleGAN模型可以自动生成图片。 它生成的高分辨率图片人眼很难辨别真假。 2021年,OpenAI推出了DALL-E,并于一年后推出了升级版本DALL-E-2。 用户只需输入简短的描述性文字,DALL-E-2就可以创作出相应的高品质卡通、写实、抽象等风格的绘画作品。 2022年7月,开源AI绘画工具Stable Diffusion发布,让普通人也能创作出专业画家级别的作品。 同年8月,一件名为《太空歌剧》的艺术作品在美国科罗拉多州博览会上获得一等奖。 这部作品是由AI创作的。 随后发布的 Make-A-Video、Imagen Video 和 Phenaki 等模型甚至可以生成带有文字描述的视频。 2022年11月30日,OpenAI发布了对话机器人ChatGPT。 至此,AIGC时代已全面开启,生成内容蓬勃发展。

经过近七十年的技术积累,AIGC已成为人工智能产业的重要实施形式。 2022年,谷歌研究人员发表了一篇题为《大型语言模型的新兴能力》的论文,发现当语言模型大到超过某个临界值时,较小模型所不具备的能力就会出现。 近年来,以GPT-4、ChatGPT为代表的大模型技术所取得的显著成果表明,增加模型规模和数据规模是突破现有技术瓶颈的有效途径。

AI模型变得越来越大,本质上是为了容纳更多的数据,但人类记录的高质量数据可能在不久的将来就会耗尽。 人工智能研究和预测组织Epoch在一篇未经同行评审的论文中预测,2023-2027年、2030-2050年和2030-2070年高质量文本数据、低质量文本数据和图像数据将被人工处理分别。 智力耗尽。

届时,基于AIGC的数据合成将成为人工智能的新燃料。 目前,人工智能产生的数据仅占所有数据的不到1%。 据咨询公司Gartner预测,到2025年,人工智能产生的数据将占所有数据的10%。 因此,尽快建立完整的AIGC产业生态系统,让用户主动与AIGC交互产生数据,从而形成数据飞轮,不断推动人工智能技术的进步。

展望未来,人工智能驱动的科学研究(AIGC for science)可能成为人工智能技术落地的深水区和新的主战场,即“人工智能开辟未来科学研究”。 过去,互联网公司的数据红利已经耗尽,但科学领域却积累了海量的实验数据。 在输入 2.8 亿个氨基酸序列后,加州伯克利的一家初创公司让模型学习蛋白质的语言,并首次从头开始合成新的蛋白质。 AIGC给科学领域带来的创新方兴未艾。 预计到2025年,超过30%的药物和材料将在AIGC的帮助下发现。

未来,人类将与AIGC联动起来卡通形象,形成内容创造和知识发现的共生体,但人类一切深层次的东西都不会被AI改变。 OpenAI首席执行官Sam Altman曾表达过这样的观点:作为人类,我们仍然关注人与人之间的互动。 人脑的奖赏机制并没有改变。 我们仍然追求快乐,有创造力,有竞争。 欲望卡通人物,成家立业的欲望……五万年前人类所关心的,一百年后人类也会关心的。

Sam Altman 还表示,ChatGPT 的火爆让大家感觉 AGI(人工智能)似乎离我们更近了,但实际上类似 ChatGPT 的大型语言模型离 AGI 还很远,我们还有很长的路要走。未来要走的路。 要走的路。 在变革与稳定之间,AIGC掀起的浪潮已经到来。 心肌梗死

插图来自:《管理视野》杂志

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计