一键美化人教教材。 AI绘画从历史到技术突破经历了怎样的经历?
最近一段时间,人工智能绘画在艺术和科技圈引起了不小的轰动,从绘画能力到版权纠纷。 究其原因,是近期AI技术在绘画领域取得了快速进展。
包括之前教育圈的轰动事件,被批评“丑”的带有图片的数学课本频频上热搜。
随后,新教材插图由中央美术学院设计团队绘制。 经过三个月的精心绘制卡通形象,小学生的课本发生了翻天覆地的变化。
手工绘画也暴露出一些问题,如缺乏时效性、浪费金钱、时间和精力等。
于是有人利用AI绘画技术来修复“丑”的插画,更快地呈现高质量的人物图像。
英国智能科技公司旗下的稳定扩散平台可以实现这样的修复,效果如下图。
由于原图中的人物脸型存在较大误差,一些修复者放弃了在原图的基础上进行修改,而是使用稳定扩散上的img2img(绘图)功能在保持原图的情况下重新绘制。作品。 。
具体操作是先用PS去除图像周围不相关的部分,然后在稳定扩散网页界面上传需要修复的图像,粘贴通用反向提示词,输入正向指示词引导AI绘画。
接下来就是调整batch参数,让AI生成16张图片,最终的结果是16张图片。
由于AI绘图结果的随机性,需要多生成几张图片,选出最符合大众审美需求的图片。 经过精心挑选和比较,选出了最符合传统民教版教材的小男孩形象,并添加了一些新时代元素,赢得了网友的大量好评。
从这个角度来看,AI技术完全有可能在绘画领域取代画家的一些基础工作。 难怪很多人再次感受到人工智能的威胁。
看到这里,很多人也感叹,AI才发展了几年,怎么能这么快取代人类画家呢?
AI绘画历史发展背景
人工智能从1956年至今已经发展了六十多年,可以说学术界和工业界不同人有不同的看法。 AI绘画在上个世纪也出现了。
我们将人工智能绘画的发展历史分为以下四个阶段:
第一阶段是AI应用发展期:20世纪70年代初至80年代中期。
20世纪70年代出现的专家系统模拟人类专家的知识和经验来解决特定领域的问题。 人工智能逐渐走下神坛,走进寻常百姓家。
从一般推理策略的讨论转向。 人工智能在医学、化学、地质等领域取得了成功,人工智能的发展从此迎来了新的高潮。
与此同时,1973年,哈罗德·科恩已经开始尝试用计算机程序“AARON”来创作绘画。 与目前的AI绘画不同的是,ARRON使用机械臂在画布上绘画,而不是数字绘画。
第二阶段是发展低迷时期:20世纪80年代中期至90年代中期。
随着人工智能应用规模不断扩大,专家系统的应用领域狭窄、缺乏常识性知识难以获取、推理方法单一。
然而,科学家们仍在进行艰难的探索和尝试。 20世纪80年代,ARRON学会了如何在绘画中表达三维物体; 20世纪90年代,学会了运用色彩进行绘画的功能,并绘制了多种作品。 直到今天,它仍然在创作。
第三个阶段是稳定发展期:20世纪90年代中期至2010年。
现阶段,网络技术特别是互联网技术的发展加速了人工智能的创新研究,推动了人工智能技术的进一步实用化。
1997年,国际商业机器公司的深蓝超级计算机击败了国际象棋世界冠军卡斯帕罗夫,智能地球的概念由此诞生。 这些都是这一时期的标志性事件。
第四阶段是蓬勃发展时期:2011年至今。
随着大数据、云计算、互联网、物联网等信息技术的发展,泛在传感数据、图形处理器等计算平台、人工智能技术迅速发展,图像分类、语音识别、知识问答等和答案,人机棋就出现了。 无人驾驶人工智能技术实现了从不能用、难用到可用的技术突破,迎来爆发式增长的新高潮。
从Google Trends提供的搜索指数来看,“AI绘画”在2004年至2007年间成为热搜词; 2008年以后,搜索热度开始下滑,进入平静期; 时至今日,AI绘画再次成为大众关注焦点的热门词汇。
为什么AI绘画发展如此迅速,我们需要从AI的核心技术——深度学习说起。
AI绘画从简单到复杂的进阶史
深度学习在计算机视觉领域的发展可以追溯到2012年,AI学者Andrew Ng和Geff等人的猫脸识别实验。
通过一千台计算机创建了一个拥有多达十亿个连接的神经网络。 在用数万张猫脸图片训练模型后,它最终画出了一张模糊的猫脸,这意味着机器学会了自己识别猫脸。
此后,科学家们不断在AI图像生成方向进行深入研究,并提出了GAN生成对抗网络,通过生成器和判别器之间的相互博弈不断提高生成能力。
这就像老师检查学生的画是否像它一样。 如果没有,学生再修改一遍,以此类推。
从2015年到2022年,研究人员对绘画模型进行了大量探索,但此时AI还无法根据文本生成图片。
直到2021年1月,OpenAI陆续发布了两个连接文本和图像的神经网络dalle和clip。
Clip基于大规模图像和文本数据集进行比较学习训练,提取文本和视觉特征相互匹配。 也就是说,AI可以将文本猫与猫图像关联起来,而且关联特征非常丰富。
Clip 上线一年后,即 2022 年 2 月吉祥物,Somani 和来自多个开源社区的其他工程师制作了一款 AI 图像生成器迪斯科扩散器。
它可以理解输入的主要内容、艺术风格、结构、视角和修饰符,生成的图片更加绚丽。
作为一个免费的开源项目,Disco Diffusion 可以使用 Google colab 上的浏览器运行。 AI绘画从此进入大众视野。
然而,大众真正开始了解AI绘画是从2017年4月谷歌提出Sketch-RNN模型开始的。
Sketch-RNN基于Seq2Seq模型构建,采用变分推理方法。 该模型的训练使用了数千张手绘简笔画图片的集合,其中包含数百个类别。
经过训练ai绘画生成器怎么玩,模型能够绘制一些简单的图画。 谷歌在论文《A Neural Representation of Sketch Drawings》中详细介绍了这个模型,并随后开源了相关代码。
Sketch-RNN模型受到了广泛的关注,一些开发者基于该模型开发了一些有趣的应用程序。 其中一个在线应用程序称为“与神经网络一起绘图”。 人们可以使用鼠标绘制图形并选择想要生成的图形类别。 网站可以通过多种方式自动帮助您完成整个图形。
Sketch-RNN模型之后,大量的AI绘画模型不断涌现。
2017年7月,创意对抗网络(CAN)模型出现,试图让AI画出风格和图片类型更加多样化的图片。
与传统的GAN结构一样,CAN也包含两部分:生成器和判别器。
在人工评估中,人们认为 CAN 模型的绘画与人类艺术家的绘画一样有创造力。 虽然创造力是一个相对主观的评价指标,但这仍然是AI学习绘画的历史性一步。
人类是具有高级审美趣味的智慧生物。 对于科技呈现的作品ai绘画生成器怎么玩,人们会选择注入人类的智慧和精彩的想法,而不是完全依靠科技来生成千篇一律的作品。
人类的创造力体现在创造和使用技术的各个方面。
科技再现传统美学
海德格尔曾经说过,技术是人类的载体。 技术能否造福人类,取决于使用者如何使用它。
用在这里是非常合适的。 也许传统画家的作品还没有被取代,但健康的艺术环境已经被不良演员破坏了。
无论是艺术还是艺术的理念,都从未停止过演变。 人工智能不仅会产生新的艺术形式,还将塑造美的概念。 艺术将在未来继续存在。 至于新的艺术形式会是什么样的变革,一切还有待讨论。
- 本文固定链接: https://wen.nuanque.com/katong/15808.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。