您的位置:首页>科技>

人工智能如何将1896年古董电影提升到4K

当50秒的无声短片L'Arrivéed'un Train en gare de La Ciotat于1896年首映时,据报道,一些看戏的人为了安全而奔跑,认为一辆即将来临的火车就在眼前冲破了银幕。任何时候,都是Looney Tunes风格的。考虑到原始电影的模糊,低分辨率质量,这是一个疯狂的想法。值得庆幸的是,那些惊慌失措的电影发烧友们从未见过Denis Shiryaev发行的AI增强版,或者说他们绝对会倒闭。

Shiryaev利用DAIN和Topaz Labs的Gigapixel AI两个公开可用的增强程序,将原始素材转换为4K 60FPS剪辑。根据Topaz Labs网站,Gigapixel AI使用专有的插值算法,可以“分析图像并识别细节和结构并'完成'图像”。实际上,Topaz教会了AI即使在将图像放大多达600%之后也可以准确地锐化和澄清图像。另一方面,DAIN可以想象并在现有视频剪辑的关键帧之间插入帧。该概念与4K电视上的运动平滑功能相同,只有您的父母才能使用。但是,在这种情况下,它添加了足够的帧以将速率提高到60 FPS。

这两个都是升级技术的例子,自1998年第一台高清电视投放市场以来,升级技术一直是广播娱乐的重要组成部分。老式学校的标清电视以720x480分辨率显示,可以一次显示的内容总价值为345,600像素。高清晰度电视显示的分辨率为1920×1080,即2,073,600总像素,是SD分辨率的六倍,而4K电视机(分辨率为3840x2160)则需要8,294,400像素。

您需要额外填充600万像素以放大HD图像以适合4K屏幕,因此升频器必须弄清楚要显示哪些像素。这就是内插过程的用处。内插基于周围新像素的显示来估计这些新像素中的每一个应显示的内容。但是,有很多不同的方法可以用来衡量。

“最近邻居”方法只是用与它们的最近邻居相同的颜色填充空白像素(因此命名)。它简单有效,但会产生锯齿状,明显像素化的图像。双线性插值需要更多的处理能力,但它使电视能够根据每个空白像素的两个最近邻居来分析每个空白像素,并在它们之间产生梯度,从而使图像清晰。另一方面,双三次插值从其16个最近邻居中采样。与原始图像相比,通过结合双线性和双三次插值的结果,电视可以准确着色,但图像仍然模糊,电视可以解决每个过程的缺陷,并生成光学质量下降(锐度和偶发伪像)损失最小的放大图像。 。

由于插值过程本质上是一个猜谜游戏,为什么不让AI做主呢?使用深度卷积神经网络,诸如DAIN之类的程序可以分析和映射视​​频剪辑,然后在现有帧之间插入生成的填充图像。

效果绝不是完美的。Engadget的视频制作人Chris Schodt在仔细检查后发现了许多视觉伪影,包括火车动荡和行人融合。“简而言之,它看起来像YouTube一样大小,” Schodt告诉Engadget。“但是把它炸到全屏,我感觉前景物体和物体内部都还不错,但是如果你看物体边缘或背景物体,接缝会散开一些。”

免责声明:本文由用户上传,如有侵权请联系删除!