AI 软件
5月18日,一篇华人一作论文发布了一款名为 DragGAN 的图像编辑模型,该论文已入选 SIGGRAPH 2023。这是一个非常直观的图像编辑模型,用户只需要控制图像中的像素点和方向,就可以让图像变形。
把大象P转身只需拖动鼠标就能实现成为现实,论文展示的DragGAN功能效果显示,以一种全新的控制方法非常灵活、强大且简单,有手就行,只需在图像上「拖动」想改变的位置点(操纵点),就能合成你想要的图像。
DragGAN 一经发布就火爆全网,其展示的AI 修图视频更是在国内外社交媒体上疯传,不仅直接蹿升 B 站关键词联想搜索第一,视频播放上百万,微博、推特也是火得一塌糊涂,转发者纷纷直呼 "這是要顛覆PS的節奏 "。
为何如此火爆?
通过DragGAN 以后P图真的只需要 " 轻轻点两下 ",AI 就能彻底理解你的想法,高效生成想要的效果无需复杂的操作,“有手就行”!
看看部分效果展示就知道,小到竖起狗子的耳朵:
大到让整只狗子蹲下来,甚至让马岔开腿 " 跑跑步 ",都只需要设置一个起始点和结束点,外加拽一拽就能搞定:
不止是动物的调整,连像汽车这样的 " 非生物 ",也能一键拉升底座,变敞篷,甚至升级成 " 加长豪华车 ",或是车车未规范停车,只需一拉一拽自动摆正:
这还只是DragGAN这个模型 AI 修图的 " 基操 "。要是想对图像实现更精准的控制,只需画个圈给指定区域 " 涂白 ",如图想让狮子转个头,一拖一拉就能让狮子转个头看向你;张开或闭合狮子的嘴巴。
或是让照片中的小姐姐 " 眨眨眼 ",遇到拍照时人物表情管理不到位的图片,也可以通过一拉一拽轻松实现表情管理,也可将一个人的表情从平淡变成微笑,着实不要太香...
虽然 DragGAN 目前还只是发布一篇研究论文,没有上源代码但它已经引起了很多人的关注。DragGAN 类似于 Photoshop 中的扭曲变形(Warp)工具,但更加强大,因为它不是“挤压像素”,而是“重新生成物体”,甚至可以旋转三维图像。目前这个项目在 GitHub 上已经有快10k+ Star,热度还在不断上涨中(尽管一行代码还没发)。
研究论文中还展示了一些演示案例,包括拽出夕阳,增加山峰的高度,这个就比较魔幻了,仔细看就连水中倒影也自动增加了高度。还有改变模特的姿势和衣服的长度和形状等等...
目前很多AI模型可以实现文字生成图片的功能,但不能编辑 AI 生成的图像。未来,如果将DragGAN 与AI图像生成工具搭配使用,用户将能够实现更接近他们心目中的图像的输出。
论文页面还有很多功能展示,小编就不做过多介绍了,感兴趣的小伙伴可以移步 SIGGRAPH 2023 上的 DragGAN 介绍页面:https://vcai.mpi-inf.mpg.de/projects/DragGAN/
或关注第一作者的Gihub账号:https://github.com/XingangPan/DragGAN
虽然 DragGAN 目前还只是一个演示,但不难看出大家的期待,实际上手的效果究竟如何,我们可以等 6 月论文代码开源后,一测见真章。
31