从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?

让图像看起来更好的 AI 工具,往往会导致图像失真,而让图像看起来更真实时,往往会缺少美感,这一问题该如何权衡?

从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?

在悬疑和科幻作品中,我们经常能看到这样的场景:计算机屏幕上显示出一张模糊的照片,然后调查人员要求增强图像,然后图像就神奇的变得清晰,揭示出重要线索。

这看起来很棒,但其实几十年来这一直是完全虚构的情节。即使在 AI 生成能力开始增长的一段时间内也很难做到:「如果你只是单纯地将图像放大,它会变得模糊。确实会有很多细节,但都是错误的,」英伟达应用深度学习研究副总裁 Bryan Catanzaro 说道。

不过,研究人员最近开始将 AI 算法融入图像增强工具,使这一过程变得更加简便和强大,但从任何图像中检索的数据仍然存在限制。但随着研究人员不断推动增强算法的发展,他们正在寻找应对这些限制的新方法,甚至找到了克服这些限制的方法。

过去十年,研究人员开始使用生成对抗网络(GAN)模型来增强图像,这种模型能够生成详细而令人印象深刻的图片。

以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:「图像突然变得好看多了。」但他同时惊讶地发现,由 GAN 生成的图像显示出很高的失真水平,失真水平衡量了增强图像与所显示的底层现实之间的接近程度。GAN 生成的图像看起来漂亮自然,但实际上它们在「虚构」或「幻想」那些不准确的细节,这导致了高度的失真。

Michaeli 观察到照片修复领域分为两大类:一种展示了漂亮的图片,其中许多是由 GAN 生成的。另一种展示了数据,但没有展示很多图片,因为看起来不好看。

2017年,Michaeli 和他的研究生 Yochai Blau 更正式地探究了各种图像增强算法在失真与感知质量上的表现,使用了与人类主观判断相关的感知质量已知度量。正如 Michaeli 所预期的,一些算法的视觉质量非常高,而其他一些算法非常准确,失真很低。但是没有一个同时具备这两种优势,你必须选择其中之一。这被称为感知失真权衡。

Michaeli 还向其他研究人员发起挑战,要求他们提出能够在给定失真水平下产生最佳图像质量的算法,以便在漂亮图片算法和良好统计数据算法之间进行公平比较。从那时起,数百名 AI 研究人员提出了他们的算法的失真和感知质量,并引用了描述这种权衡的 Michaeli 和 Blau 的论文。

有时感知失真权衡的影响并不可怕。例如,英伟达发现高清屏幕不能很好地渲染一些低清视觉内容,因此在2023年2月份推出了一款使用深度学习来提升流媒体视频画质的工具。在这种情况下,英伟达的工程师选择了感知质量而不是准确性,他们接受了这样一个事实,即当算法提升视频分辨率时,它会生成一些原始视频中没有的视觉细节。

「模型是在进行幻想。这完全是猜测,」Catanzaro 说道。「超分辨率模型大部分时间猜错都没关系,只要是一致的就行。」

从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?

小鼠大脑血流的视图(左)以及使用 AI 工具提高图像质量和准确性后得到的相同视图。图源:杜克大学 Junjie Yao、Xiaoyi Zhu 。

特别是,研究和医学领域的应用会要求更高的准确性。AI 技术在成像方面取得了重大进展,但杜克大学的生物医学工程师 Junjie Yao 表示:「它有时会带来不希望的副作用,比如过度拟合或添加虚假特征,因此需要极其谨慎地对待。」

去年,他在论文中描述了如何利用 AI 工具改进现有的大脑血流和新陈代谢测量方法,同时在感知失真权衡的准确一侧安全运行。

绕过从图像中提取多少数据的限制的一种方法是简单地合并来自更多图像的数据。此前,通过卫星图像研究环境的研究人员已经在整合不同来源的视觉数据方面取得了一些进展:在2021年,中国和英国的研究人员将来自两种不同类型卫星的数据融合在一起,以更好地观察刚果盆地的森林砍伐情况。刚果盆地是世界上第二大热带雨林,也是生物多样性最丰富的地区之一。研究人员获取了两颗 Landsat 卫星的数据,这些卫星数十年来一直在测量森林砍伐情况,并使用深度学习技术将图像的分辨率从30米提高到10米。然后,他们将这组图像与两颗 Sentinel-2卫星的数据融合在一起,这些卫星具有稍有不同的探测器阵列。他们的实验表明这种综合图像「使得比单独使用 Sentinel-2或 Landsat-7/8图像时能够检测到11% 至21% 更多的受干扰区域」。

如果不能直接突破,Michaeli 提出了另一种硬性限制信息可获取性的方法。与其就如何增强低质量图像寻求确定的答案,不如让模型展示对原始图像的多种不同解释。在论文《Explorable Super Resolution》中,他展示了图像增强工具如何向用户提供多个建议。一个模糊的、低分辨率的穿着似乎是灰色衬衫的人的图像可以被重建成更高分辨率的图像,在这个图像中,衬衫可以是黑白垂直条纹、水平条纹或格子,所有这些都同样合理。

从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?

在另一个例子中,Michaeli 拍摄了一张低质量的车牌照片,并使用 AI 图像增强处理,结果显示车牌上的数字1最像是0。但当图像经过 Michaeli 设计的不同的、更加开放式的算法处理时,这个数字看起来同样有可能是0、1或8。这种方法可以帮助排除其他数字,而不会错误地得出这个数字是0的结论。

我们可以减轻这些幻觉,但是那个强大的、解决犯罪的「增强」按钮仍是一个梦想。

在不同的领域中,各种学科以各自的方式在感知失真权衡方面进行探讨,从 AI 图像中能够提取多少信息,以及能够信任这些图像的程度仍然是核心问题。

「我们应该牢记,为了输出这些漂亮的图像,算法只是编造了细节,」Michaeli 说道。

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/

声明:本文内容整理自网络,观点仅代表原作者本人,投稿号仅提供信息发布服务。如有侵权,请联系管理员。

(0)
上一篇 2023年10月9日 18:18
下一篇 2023年10月9日 18:18

热点推荐

  • 黄山风景区门票预约已达最大承载量

    截至中午11点30分,黄山风景区接待游客35万人,达最大承载量,已停止售票黄山风景区保护管理指挥调度中心是景区信息化管理的中枢,DLP屏幕上清晰显示各个交通要道游客集散地实时画面以及当前进山人数索道人数等人流量信息。 之前黄山风景…

    热点 2022年10月3日
    176
  • 微店怎么注册开店流程(怎么开微店)

    提起怎么开微店,大家都知道,有人问微店怎么注册开店流程,你知道这是怎么回事?其实微店怎么注册开店流程,下面就一起来看看怎么开微店,希望能够帮助到大家! 微信上如何开通微店 微信上开通微店的方法如下: 1、下载安装微店APP并翻开,…

    热点 2023年4月2日
    138
  • 女子失业被妈妈雇佣当司机日薪20 网友:灵活就业的范例

    据@中国网看点报道:11月12日,山西晋中。一25岁女生失业后和刚退休的爸爸被妈妈雇佣当上下班接送司机,每人日薪20元。 当事人小宿称,原先在北京工作了2年,半月前被裁员,找工作也屡屡碰壁。妈妈为了缓解自己找工作碰壁,爸爸刚退休无…

    热点 2023年11月13日
    104
  • dj阿u酱没尊严是什么歌(dj阿u酱没尊严是什么歌)

    最近一段时间抖音dj阿u酱没尊严这首歌非常火爆,但是只是知道这句歌词,不知道歌名,不少小伙伴都在问dj阿u酱没尊严是什么歌?谁唱的?歌词完整版有吗?下面小编为大家带来抖音dj阿u酱没尊严歌名及歌词完整版分享,感兴趣的小伙伴一起来看…

    热点 2023年3月25日
    201
  • 我国2024年元旦档电影票房创新高

    新华社北京1月2日电(记者王鹏)国家电影局2日发布数据,2023年12月30日至2024年1月1日,我国2024年元旦档电影票房达15.33亿元,创造了新的元旦档票房纪录。观影人次为3660万,国产影片票房为14.11亿元,市场占…

    热点 2024年1月3日
    114
  • 请问中出是什么意思?

    中出一词来源于日本教育向爱情动作影片,“中出しnaka dashi”是一个表示溢出的动词,指不戴安全套就内射的行为。词义上来说,中出偏向于男方在女方反对或不愿意的情况下强行进行,有一定强迫意味。 看岛国电影里面有两个汉字出镜率很高…

    热点 2023年5月11日
    260
  • gta5矿洞位置地图_gta5矿洞位置

    gta5游乐场宝藏位置 位于地图的西南方向。GTA5中的游乐园位于地图的西南方向,(海滩的位置),游乐设施有过山车、摩天轮等等,具体位置坐标请参照下图红色圈圈标注位置。 gta5线上20个宝藏位置都是根据得到的线索去寻找的。在到达…

    热点 2023年7月3日
    415
  • 印度再次挑战登月,民间作法祈祷 这算是什么操作

    当地时间8月22日,印媒播出印度僧人举行仪式祈祷该国“月船3号”成功登陆月球的画面。现场画面显示,僧人们围坐在一起举行火供仪式并奏响乐器。

    热点 2023年8月24日
    133
  • 12306账号内出现陌生人信息,或为登录第三方平台抢票所致

    近日,不少网友反映自己的12306平台内出现了陌生乘客的购票出行信息,还无法删除,怀疑自己的信息遭到泄露。从铁路部门了解到,这是由于部分旅客此前通过第三方平台抢票时填写了12306平台的账号、密码,致使第三方平台拿到这些信息后,擅…

    热点 2023年10月15日
    110
  • 台风梅花登陆:狂风大作 暴雨横飞热

    9月15日——今日6时,中央气象台发布台风黄色预警:今年第12号台风梅花的中心已于今日(15日)凌晨0时30分左右在上海奉贤沿海再次登陆。登陆时中心附近最大风力12级(35米/秒),中心最低气压975百帕。今晨5点前,“梅花”移入…

    热点 2022年9月15日
    163

发表回复

登录后才能评论