文|李锐、甄子
上传产品图片,选择场景、图片尺寸、数量,不到一分钟即可完成3D数码、小家电、日用品等类型的产品图片。 这是灵动AI推出的AIGC产品“灵动AI产品地图”的主场景。
过去,传统的产品场景图像往往采用3D渲染或影棚拍摄的方式制作。 制作一套20张产品场景图,需要多类型的设计团队至少花费3天时间,成本超过2万元。 相比之下,使用“智能AI产品图”等生成工具,单人即可完成产品图的制作,单次生成的算力成本不到1元。
岭动AI创始人雷海波曾是中国头部视觉设计社区“视觉中国”创始人。 2014年,雷海波创立D2C创新产品孵化及智能设计平台“太火鸟”。 但2023年生成式AI的到来,让雷海波改变了他的创业历程。
扩散模型来了,GAN刚刚加入
AI生成图片,早期GAN方案是主流。 2018年到2020年,雷海波还将GAN引入其公司“太火鸟”的D2C创新产品孵化平台,帮助用户一键生成硬件产品的草图、效果图、模拟3D图。
但到了2022年中期,随着DALL-E2、Midjourney等基于Diffusion Model的大型模型的兴起表情包设计,图像生成的效果从未如此真实。 该算法生成的图像在质量和创意上也明显优于GAN,震惊了整个创意行业。
拥有20多年设计经验的雷海波也是其中之一。
雷海波在第一次领略了扩散模型的效果后发现,该算法在很多场景下的效果几乎和专业设计师的效果一样好。 为了进一步验证这一发现,他使用 Midjourney 在一个月内生成了 12,000 张图像,并加入了 Midjourney 在 Discord 上的“10,000 俱乐部”。
最终,专业人士不得不承认,Diffusion已经完全超越了人类的表现。
“第一是效率,第二是产生的效果。它均衡了初级设计师和10年经验的高级设计师的能力。” 雷海波认为,一个没有任何设计能力的非专业人士也能写出提示文字,Diffusion产生的效果已经超过了资深设计师的水平。 “这在设计界得到了认可,”他补充道。
但同时,认清现实意味着太火鸟基于GAN的技术路线几乎要被推翻,重新开始。 已经在“万俱乐部”验证了自己答案的雷海波决定“打不过就加入”,Smart AI就此成立。
雷海波表示,灵动AI以生成式AI为核心,打造从视觉设计行业大模型到创新应用的设计平台品牌视觉设计师做什么,目标是重塑专业的“营销+设计”工作流程。
在他看来,相比众多AI初创企业,岭东AI有其先天优势。 “太火鸟过去的所有技术、数据积累和资产,包括GAN时代的30多项算法专利和海量设计资源,都可以直接移植到新公司利用。”雷海波表示,通过借鉴经验和资源在太火鸟的带领下,灵动AI在两个月内就开发出了内容生成技术和产品矩阵。
“智能AI产品图谱”背后:Lora模型+专业模型
AIGC产品《Smart AI产品图谱》是Smart AI的产品代表。 雷海波表示,这是业界首款工业级AI产品地图生成工具。 该产品与京东智能新品孵化平台合作,为商家提供AIGC“营销+设计”服务。
演示中,用户只需通过“智能AI产品图”选择输出固定产品的多个场景的产品场景图片,复杂的图像处理和场景生成工作全部由系统承担。
在技术层面,雷海波介绍,“智能AI产品图谱”融合了多个特定风格场景,依托Diffusion Model训练LORA模型和多个亿参数规模的专用AI模型。 未来,公司还计划打造大型智能AI视觉设计模型。
其中吉祥物设计,专用AI模型还承担了文森图的“控制”功能。
众所周知,将AIGC应用于工作流程需要解决内容的一致性和可控性问题。 针对这一行业难题,Smart AI开发了C-VAE产品主体生成控制和C-BG背景生成控制专用模型,与动态视觉、内容理解和审美评价专用模型一起,形成了专业的模型序列。
此外,智能审美评价系统在雷海波眼中也是一道“技术壁垒”。 雷海波告诉36氪:“这套智能审美评价系统是灵动AI自主研发的一套审美评价模型。 由后端完成,用户感觉不到。” 他进一步介绍,审美评价模型综合考虑了多个视觉方面。 专业的设计规范,从整体美观度、产品材质与场景的契合度、整体色彩协调、光影、产品与场景风格契合度、构图合理性等数百个评价维度对生成的图像进行评分。 这个模型的作用是帮助用户过滤并以最好的效果呈现图片。
除了模型架构之外,雷海波还认为“没有任何团队拥有我们量级的设计数据集”。 目前,灵动AI拥有1000万设计数据集和1亿+工业产品设计数据集。
与Midjourney、Stable Diffussion等通用大视觉模型相比品牌视觉设计师做什么,“智能AI产品图”希望在易用性和专业生成效果之间取得平衡,采用模块化场景图模板来替代传统大视觉流行的文森图楷模。 “纯文森图对于普通用户来说门槛较高,因为描述专业的产品图片场景需要专业的提示文字,而大多数普通商家不具备相关能力。此外,这种方式也不利于批量产品图生成。” 雷海波解释道。
在演示中我们也看到,尽管GAN的高光时刻已经过去,但在“智能AI产品图”首页演示的效果图中,雷海波依然隐藏着一些智能硬件时代的痕迹。 比如,他将Nest智能恒温器、Misfit可穿戴设备等当年知名产品“隐藏”到生成模型生成的产品场景组图中,以此向与太火相吻合的智能硬件时代致敬鸟。
效果示例
从静到动,完善视觉大尺度模型场景
视觉模型的应用场景不仅限于图像生成,还包括视频生成。
在视觉大模型领域,图片是目前形式最多的产品,而视频则是“皇冠上的明珠”。 两者之间,Motion Graphic目前是兵家必争之地,Motion Graphic也是非常热门的设计专业。
“我们的第二个产品方向是动态生成模型,主要是营销素材的元素级动态生成。” 雷海波向36氪透露,Smart AI正在从静态生成向动态生成拓展,希望打造AI原生的“动态视觉”生成设计平台。
此前,灵动AI与孟京辉导演发起的全球首个元界戏剧节Sphinx合作,协助老郎、黄磊等艺术家完成AIGC动态宣传海报的创作。 同时,我们还与小米、京东、安踏等客户开展AIGC共创合作。
效果示例
除了产品之外,雷海波还介绍,Smart AI的核心团队来自视觉中国、THN、百度、京东等领先科技公司。 他表示,该团队成员有参与THN工业设计平台和智能设计引擎、百度文心艺阁视觉模型、京东文胜图视觉模型等开发的经验。
接下来,灵动AI计划在年底推出专注于工业产品设计领域的10亿参数大型垂直模型。 在此基础上,将开发针对特定行业的定制化应用,为广告、品牌、媒体等创意产业提供更专业、高效的解决方案。 完善的 AIGC 解决方案。
- 本文固定链接: https://wen.nuanque.com/pinpai/15022.html
- 转载请注明: nuanquewen 于 吉祥物设计/卡通ip设计/卡通人物设计/卡通形象设计/表情包设计 发表
- 文章或作品为作者独立观点不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。本文之内容为用户主动投稿和用户分享产生,如发现内容涉嫌抄袭侵权,请联系在线客服举报,一经查实,本站将立刻删除。本站转载之内容为资源共享、学习交流之目的,请勿使用于商业用途。