您的当前位置：首页>资讯 > 正文

AI靠语意理解把照片变抽象画：无需相应数据集只画4笔也保留神韵

2022-03-20 14:22:30 来源：凤凰网

只用几笔，如何勾勒一只动物的简笔画，很多人从小都没整明白的问题 —— 如今 AI 也能实现了。

下面图中，左边是三张不同的动物照片，右边是 AI 仅用线条来描出它们的外形和神态。从32笔到4笔，即使大量信息都抽象略去了，但我们还是能辨识出对应动物，尤其是最下面的猫猫，只需4笔曲线也能展示出猫的神韵：

再看这匹马，抽象到最后只保留了马头、马鬃和扬蹄飞奔的动作，真有点毕加索那幅公牛那味儿了。

更神奇的是，其背后的模型 CLIPasso 并没有在速写画数据集上训练 —— 等于说，没“学”过怎么画抽象画，按照文字描述就能完成简笔速写。

要知道，日常速写都比较抽象，即使是人来画，要想抓住物体的“灵魂”，也需要经过很久的训练。那为什么这个 CLIPasso 甚至连速写画数据集训练都没做，就能 get 到抽象简笔画的“灵魂”呢？

CLIPasso 如何画抽象画

其实 AI 画抽象简笔画比人更难。既要准确地理解语义，又要在几何上相似，才能让抽象画看起来有“像”的感觉。

具体实现上，模型会根据图像的特征图先生成初始线条的位置，然后靠 CLIP 构建两个损失函数，来控制抽象画几何相似、语义理解准确。

其中 CLIP 就是 OpenAI 发布的一个重排序的模型，它会通过打分排名来筛选出和文字匹配度最高的图片。这样一来，CLIPasso 的整体结构就比较清晰了：

例如我们要画一匹马，首先通过特征图（saliency）标记一些初始线条（S₁，S₂…S_n）的位置。然后通过光栅化（Rasterizer）把线条投影到成像平面：

接下来就是优化线条参数了。把初始图像导入 CLIP 模型，计算几何损失（L_g）和语义损失（L_s）。其中语义损失通过余弦相似度来判断两图的差异，而几何损失通过中间层来控制。

这样就能保证在准确理解语义的情况下保持几何准确，再通过反向传播不断调整线条参数，直到损失收敛。那速写的抽象程度是怎么控制的呢？

就是靠设置线条的数量。同样画一匹马，用 32 笔去画和只用 4 笔去画，抽象效果肯定是不一样的：

最后，我们来看一下 CLIPasso 画出的画辨识度怎么样。下图中这个柱形图代表的是五类动物的辨识准确度。不过在猜测的时候还有第六个选项：这五种动物都不是。

从图中可以看出，无论什么动物，在高度抽象的时候（4 笔画），辨识度都很低，随着笔画越来越多，辨识度也会逐渐提高。毕竟这么抽象的画，看不出来是啥也很正常。

但是，模型团队在第二轮测试辨识度时删除了第六个选项，也就是必须从这五个动物类型中选一个归类。这时，我们从下面的柱形图中可以看到，即使是高度抽象的 4 笔画，辨识度也提高了不少，从 36% 提到了 76%。

这就说明了之前辨认不出是太抽象导致的，AI 毕加索的画仍然抓住了动物的核心特征。目前这个模型已经出了 colab 版本，只需在左侧文件夹中添加你想要抽象化的图片，然后运行三个部分即可得到输出照片。

作者简介

CLIPasso 团队成员主要来自洛桑联邦理工学院、特拉维夫大学等。其中 Jessica 是苏黎世联邦理工学院机器人方向的硕士研究生，目前在洛桑联邦理工学院的计算机视觉实验室 VILAB 实习。

而 Yale Vinker 是特拉维夫大学计算机科学的博士研究生，对艺术和技术的交叉领域非常感兴趣，也难怪 CLIPasso 有这么丰富的艺术细胞。

标签： clipasso clip

AI靠语意理解把照片变抽象画：无需相应数据集只画4笔也保留神韵

其实AI画抽象简笔画比人更难。

一条屎的长度一般是直肠直径的5倍左右

屎与健康的关系很好理解，但屎与机械工程学的关系，就没那么好理解了。

动力电池扩产进行时铃木、福特等多家汽车厂家纷纷入局

原材料上涨也在进一步掀起新能源汽车的涨价潮。

《葫芦兄弟》《小羊肖恩》这些定格动画你用手机也能拍

在这个时代里，我们每个人都是幸运的。

QQ逐渐元宇宙化，只因有了自己的“张小龙”？

不论如何，腾讯都不能再眼看QQ的用户量继续滑落下去了。

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级

AMR智能物流机器人，推动汽车行业智慧物流应用和发展

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一

吉利帝豪S正式开启预售 8.67万元-11.07万元

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭

乐视贾跃亭回国有望？FF已提交上市文件

国内首个“5G+北斗”高速公路智能护栏预警系统上线

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

新一轮科技革命和产业变革持续演进，提高制造业生产效率

“能联全球”平台正式发布，推动全球能源电力发展合作

网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯

雷军开启个人第三场直播：小米进军智能电动汽车行业

700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”

2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

智能机器人完成多项智能巡视任务，作业效率提高三倍

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

AI靠语意理解把照片变抽象画：无需相应数据集 只画4笔也保留神韵

推荐阅读

猜您喜欢

科技快讯更多>

资讯

创新

子站

AI靠语意理解把照片变抽象画：无需相应数据集只画4笔也保留神韵