您的当前位置：首页>资讯 > 正文

全球信息:不会PS没关系 AI拼图技术已能以假乱真

2023-03-27 15:55:06 来源：凤凰网

Alex 发自凹非寺

量子位 | 公众号 QbitAI

(相关资料图)

这是一份看似平平无奇的日式便当。

但你敢信，其实每一格食物都是P上去的，而且原图还是酱婶儿的：

△

直接抠图贴上去，效果一眼假

背后操作者并不是什么PS大佬，而是一只AI，名字很直白：拼图扩散（Collage Diffusion）。

随便找几张小图拿给它，AI就能自己看懂图片内容，再把各元素非常自然地拼成一张大图——完全不存在一眼假。

其效果惊艳了不少网友。

甚至还有PS爱好者直呼道：

这简直是个天赐之物……希望很快能在Automatic1111（ Stable Diffusion用户常用的网络UI，也有集成在PS中的插件版）中看到它。

为什么效果这么自然？

实际上，此AI生成的“日式便当”还有好几个生成版本——都很自然有木有。

至于为啥还有多种版本？问就是因为用户还能自定义，在总体不变得太离谱的前提下，他们可以微调各种细节。

除了“日式便当”，它还有不少出色的作品。

比如，这是拿给AI的素材，P图痕迹明显：

这是AI拼好的图，反正我愣是没看出什么P图痕迹：

话说这两年，“文字生成图像的扩散模型”着实大火了一把，DALL·E 2和Imagen都是基于此开发出来的应用。这种扩散模型的优点，是生成图片多样化、质量较高。

不过，文字终究对于目标图像，最多只能起到模糊的规范作用，所以用户通常要花大量时间调整提示（prompt），还得搭配上额外的控制组件，才可以取得不错的效果。

就拿前文展示的日式便当来说：

如果用户只输入“一个装有米饭、毛豆、生姜和寿司的便当盒”，那就既没描述哪种食物放到哪一格，也没有说明每种食物的外观。但如果非要讲清楚的话，用户恐怕得写一篇小作文了……

鉴于此，斯坦福团队决定从别的角度出发。

他们决定参考传统思路，通过拼图来生成最终图像，并由此开发出了一种新的扩散模型。

有意思的是，说白了，这种模型也算是用经典技术“拼”出来的。

首先是分层：使用基于图层的图像编辑UI，将源图像分解成一个个RGBA图层（R、G、B分别代表红、绿、蓝，A代表透明度），然后将这些图层排列在画布上，并把每个图层和文字提示配对。

通过分层，可以修改图像中的各种元素。

到目前为止，分层已经是计算机图形领域中一项成熟的技术，不过此前分层信息一般是作为单张图片输出结果使用的。

而在这种新型“拼图扩散模型”中，分层信息成了后续操作的输入。

除了分层，还搭配了现有的基于扩散的图像协调技术，提升图像视觉质量。

总而言之，该算法不仅限制了对象的某些属性（如视觉特征）的变化，同时允许属性（方向、光照、透视、遮挡）发生改变。

——从而平衡了还原度和自然度之间的关系，生成“神似”且毫无违和感的图片。

操作过程也很easy，在交互编辑模式下，用户在几分钟内就能创作一幅拼贴画。

他们不仅可以自定义场景中的空间排列顺序（就是把从别处扣出来的图放到适当的位置）；还能调整生成图像的各个组件。用同样的源图，可以得出不同的效果。

△

最右列是这个AI的输出结果

而在非交互式模式下（即用户不拼图，直接把一堆小图丢给AI），AI也能根据拿到的小图，自动拼出一张效果自然的大图。

研究团队

最后，来说说背后的研究团队，他们是斯坦福大学计算机科学系的一群师生。

论文一作，Vishnu Sarukkai现为斯坦福计算机科学系研究生，还是硕博连读的那种。

他的主要研究方向为：计算机图形学、计算机视觉和机器学习。

此外，论文的共同作者Linden Li，也是斯坦福计算机科学系研究生。

在校求学期间，他曾到英伟达实习4个月，与英伟达深度学习研究小组合作，参与训练了增加100M+参数的视觉转换器模型。

— 完—

标签：

全球信息:不会PS没关系 AI拼图技术已能以假乱真

不会PS没关系AI拼图技术已能以假乱真

微动态丨“全无人驾驶出租车，滚出旧金山！”

追尾公交车，闯入警戒区

环球即时看！新冠病毒或能改变人体细胞基因组结构有助解释“长新冠”

新冠病毒是否以及如何影响人体内的染色质一直是未解之谜。

NVIDIA：显卡挖矿对社会一点用处都没有

全球最资讯丨特斯拉失控撞上街边店铺目击者：司机开过公交车驾龄20多年

你觉得“刹车失灵”、“踩错踏板”，哪个可能性更大呢？

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级

AMR智能物流机器人，推动汽车行业智慧物流应用和发展

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一

吉利帝豪S正式开启预售 8.67万元-11.07万元

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭

乐视贾跃亭回国有望？FF已提交上市文件

国内首个“5G+北斗”高速公路智能护栏预警系统上线

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

新一轮科技革命和产业变革持续演进，提高制造业生产效率

“能联全球”平台正式发布，推动全球能源电力发展合作

网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯

雷军开启个人第三场直播：小米进军智能电动汽车行业

700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”

2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

智能机器人完成多项智能巡视任务，作业效率提高三倍

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品，均转载自其它媒体，转载目的在于传递更多的信息，并不代表本网赞同其观点和对其真实性负责。亚洲科技网倡导尊重与保护知识产权，如发现本站文章存在内容、版权或其它问题，烦请联系。联系方式：8 86 239 5@qq.com，我们将及时沟通与处理。

全球信息:不会PS没关系 AI拼图技术已能以假乱真

推荐阅读

猜您喜欢

科技快讯更多>

资讯

创新

子站