首页 > Midjourney > ai绘画midjourney-AI绘画的“小秘密”都在这篇文章里
2024
01-16

ai绘画midjourney-AI绘画的“小秘密”都在这篇文章里

视觉中国供图

◎本报记者 金峰

有了人工智能,人人都可以成为艺术家。 AI绘画的出现正如瑞士艺术家保罗·克利所说:“艺术不是再现可见的东西,而是让不可见的东西变得可见”。 经过大约20年的发展,目前基于不同类型或模态元素的AI绘画发展有所不同。 尽管如此ai绘画midjourney,发展时间最长的是“图片制作图片”,然后是最近流行的“文字+图片”制作图片。 当然,也有团队开发了从语音生成图像的技术。

上传一张图片或者输入一些简单的关键词,系统就会自动生成一张卡通形象……最近,人工智能绘画在互联网社交平台上火了起来。

AI绘画,顾名思义,就是利用人工智能进行绘画。 是人工智能生成内容的典型应用场景之一。 主要原理是收集大量已有的作品,通过算法分析其内容和风格特征,最终生成新的作品,所以算法是AI绘画的核心。

目前,“凭空”生成图像的AI画作,其实可以动不动就“翻车”:也许上一秒AI通过你的照片画出艺术二维肖像,下一秒你的宠物猫、狗狗可能被画成可爱的女孩或肌肉发达的男人。

事实上,人工智能绘画早已风靡全球。 第一幅公开展出的人工智能创作的画作《埃德蒙·贝拉米的肖像》于 2018 年在佳士得拍卖行以 432,500 美元的价格售出。 这是一幅由机器学习从 19 世纪到 20 世纪 15000 张肖像中自动生成的 14 幅肖像作品。

AI绘画如何实现“凭空”绘图? 除了娱乐之外,AI绘画还有哪些潜在应用?

从“图像生成图像”到“语音生成图像”

2022年,人工智能创作的“太空歌剧”走红。 在美国科罗拉多州举办的新兴数字艺术家大赛中,《太空歌剧》荣获“数字艺术/数字修饰照片”类别一等奖。 其构图、色彩搭配、画面细节都十分精美。 不过,这部作品的创作者并非艺术家,而是一位来自美国科罗拉多州的游戏设计师。

游戏设计师首先在一款名为“中途”的AI创作工具中输入光源、构图、氛围等几个关键词,得到了100个作品。 然后他花了大约80个小时对图像进行编辑和修改,最后选择了3幅作品并将图像打印到画布上。

通过简单的互动对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场“AI绘画作品的竞争是否作弊”的争论。 这场巨大的争论也让大众直观地意识到目前AI绘画的水平已经发展到什么程度。

“人工智能在艺术上的创造可以追溯到上世纪末,当时的人工智能绘画技术被称为‘图像的风格化滤镜’。” 中国科学院自动化研究所多模态人工智能系统国家重点实验室研究员董伟明表示,最初的AI绘画方式比较简单,比如拍一张普通照片,利用一些图像处理算法对照片像素进行变换几何或色彩,然后调整不同的参数来模拟油画。 或者水彩风格。

经过约20年的发展,基于不同类型或模态元素的AI绘画目前的发展情况有所不同。 发展时间最长的是“图片生产图片”,然后是最近流行的“文字+图片”生产图片。 当然,也有团队开发了从语音生成图像的技术。

AI绘画主要依靠三种技术模式来实现

董伟明介绍,AI绘画目前主要借助图像风格迁移技术、图文预训练模型和扩散模型来实现。

图像风格迁移技术是指通过提取输入的真实图像内容特征和参考艺术图像风格特征,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像的图像处理算法。 ”董伟明举了个例子,如果把旧金山美术宫的外景照片和印象派创始人莫奈的作品结合起来,通过图像风格转移技术ip形象,就可以得到一幅看起来像旧金山的画作的画面。莫奈画的弗朗西斯科艺术,宫殿画,最初的AI绘画就使用了这种技术。

不过,在董伟明看来,图像风格迁移技术大多依赖于生成对抗网络(GAN)算法。 它最大的问题是生成的画作不太艺术,笔触和构图让人感觉与真实的画作不同。 差距,所以很长一段时间以来,AI绘画一直是“默默无闻”。

当图像风格迁移技术还在努力解决输出作品的美观问题时,图文预训练模型的出现加速了AI绘画的兴起。

“依托图像和文本预训练模型,只要输入一句话或者上传一张风格清晰的图片,算法就能将图像特征和文本特征‘对齐’,生成的画作的内容特征是相似的就上传的图片来说ip形象,艺术性也比图像风格迁移技术生成的图片好很多。” 董伟明举了一个例子。 例如,支持图像和文本预训练模型的可比语言-图像预训练(CLIP)算法利用图像和文本特征“对齐”的能力,结合现有的生成模型实现“图片生成图片”或“图片+文字”制作图片。

不过,董伟明坦言,图解预训练模型的推广存在一些争议。 有人认为,该模型在训练初期需要大量图形处理单元(GPU)进行数据训练ai绘画midjourney,消耗大量电量,成本高昂。 很高,但是这个模型的应用场景还不够明确。 但也有人认为,或许这个模型未来可以构建为通用人工智能模型,用来完成更多的算法任务,但这还需要时间来验证。

诚然,没有任何技术是完美的,这也为人类探索更先进的技术提供了无限动力。 当今最流行的扩散模型之一就是其中之一。

“目前最新的AI绘画技术采用的是扩散模型,该模型可以将随机采样的噪声输入到模型中,然后尝试通过去噪来生成图像。” 董伟明表示,扩散模型也有弱点,因为模型识别图像内容的能力不足,或者难以完全理解识别文本的含义,以及训练数据存在偏差,有时会产生“不一样”的作品。 另外,扩散模型生成图像速度较慢,目前无法实时生成图像。

互联网治理、元宇宙或隐藏的应用前景

目前AI绘画的应用场景更多集中在社交软件上。 最近在国内社交网络上流行的AI绘画软件主要集中在小程序和App上。 随着AI画画小程序的火爆,短视频平台抖音迅速推出了AI画画特效。 与此同时,腾讯此前推出了“QQ小世界AI画家”活动,百度也推出了首个AI艺术创意辅助平台“文心艺阁”。

有了人工智能,人人都可以成为艺术家。 AI绘画的出现正如瑞士艺术家Paul Klee所说:“艺术不是再现可见的,而是让不可见的变得可见。” “人工智能现在已经完美地实现了这个目标,人们可以通过机器计算绘制出很多现实中从未见过的场景。” 董伟明设想,在不久的将来,AI绘画或许还会展现出更丰富的应用场景。

“现在网络上充斥着很多不良内容,这些内容往往以绘画的形式出现,以逃避监管。 目前的许多内容识别模型在识别真实图片方面非常准确,但它们缺乏与不良内容的艺术品相关的训练数据,因此无法识别不良内容。 内容识别不准确。 或许AI绘画技术可以用来积累不良内容艺术品的数据,用来训练识别模型,提高互联网内容的安全监管能力和识别的准确性。”董伟明建议。

董伟明表示,AI绘画作为一种艺术呈现形式,也将催生元宇宙、设计、文旅等行业的新商业模式。 例如,AI绘画目前在AI辅助创作、短视频、影视制作、元宇宙等方面都有布局。 因为这些轨迹都离不开创意,AI绘画可以帮助创作者通过简单的特征输入实现创意。 预览甚至直接创建。

不过,董伟明并未否认AI绘画仍存在版权纠纷。 AI绘画的核心是模型,训练模型需要使用大量的图像和文本数据。 对于未经授权的图像,很难确定计算后生成的图像的版权归属。 “有些画家的风格特别明显,如果用艺术家的画来训练算法模型来生成作品,那么最终的版权将归谁呢?” 董伟明提出的问题,正是大多数AI绘画面临的现实问题。

AI绘画掀起了一场资本的集体狂欢。 希望有一天它能够摆脱“画猫画虎”的尴尬,真正为艺术创作服务,创造更多价值。

最后编辑:
作者:nuanquewen
吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计