您的位置:首页>AI>

富士通借助压缩技术简化了AI视频识别

富士通实验室有限公司开发了一种技术,用于将超高清,大容量视频数据压缩到AI视频识别应用所需的最小大小。这项技术可以将视频数据压缩到使用常规压缩技术准备的,供人类视觉确认的数据大小的十分之一。

近年来,各个业务领域对视频数据的AI分析的需求急剧增加。尤其是第五代移动通信系统(1)的普及 ,预计将极大地增加相机拍摄的超高清视频图像的数量,以及在街上和路上拍摄的许多图像的数量。生产线。

在开发这项新的压缩技术时,富士通专注于AI和人类识别图像的方式上的重要差异。即,在识别视频数据中的人,动物或物体时,人工智能和人类在图像区域上往往会有所不同,这些区域被认为对判断很重要。富士通开发了一种技术,可以自动分析AI所重视的区域,并将数据压缩到AI可以识别的最小大小。这使得可以分析大量视频数据而不会影响识别精度,同时可以显着降低操作和数据传输成本。还可以预料,该技术将允许用户通过组合存储在云中的多个视频数据,传感器数据和性能数据(例如销售数据)来分析更高级的视频数据。

背景与挑战

近年来,使用AI分析图像的技术发展迅速,并且有望成为许多行业中许多公司进行数字化转型的驱动力之一。随着2020年复杂的5G移动服务的到来,对AI分析的需求预计会进一步增加,同时超高清4K和8K摄像机以及大量视频数据在包括行为分析在内的应用中的使用也将增加。制造业和零售业。

尽管如此,对于用于图像分析的深度学习技术的处理要求仍提出了巨大的挑战。一种确保处理这些任务的计算能力的有效技术是与云一起处理,但是由于视频数据通常非常占用资源,因此需要一种可以将所有视频数据传输到云的高压缩技术。而不会影响质量,从而不会使网络带宽过载。

关于最新技术

压缩视频会根据压缩率降低图像质量,并且如果AI聚焦的区域过度压缩,识别精度会降低。富士通开发了一种视频压缩技术,该技术可以自动分析一帧视频数据图像中被AI识别为判断材料的对象的区域, 以每个区域识别所需的最低图像质量对图像进行压缩(2)(图1)。与传统的压缩技术相比,通过应用此技术,可以显着减小视频数据的大小,同时保持识别精度。

自动估算压缩比而不影响AI识别精度的技术

针对每个区域分析了特定于压缩的图像质量下降对识别精度的影响。根据AI识别结果自动估计不影响识别精度的压缩率(图2)。

当改变整个图像的压缩比并改变图像质量时,通过汇总对识别结果的影响,可以确定所有区域中AI在识别过程中特征的重要程度。将紧接在每个区域中的识别精度迅速恶化之前的压缩率估计为不影响识别精度的压缩率。

它还会反馈连续图像的AI结果,以将压缩率提高到AI可以识别的最大范围。这样,该技术在保持AI识别精度的同时实现了高图像压缩。

影响

新开发的技术已应用于由多名工人打包在工厂中的4K摄像机拍摄的视频镜头。可以确定的是,数据大小可以减小到传统压缩技术的数据大小的1/10,而不会降低识别精度。预计该技术将用于不需要严格实时性能的应用程序,以及用于分析高级视频数据的分析,该高级视频数据将存储在云中的多个视频数据,传感器数据以及性能数据(例如销售数据)结合在一起。

未来的计划

富士通实验室正在各种情况下对该技术进行评估,并正在进行进一步的研究和开发,以进一步改善压缩性能。富士通有望在2020财年末将该技术商业化,并将其引入不同行业的各种应用中,包括其富士通制造业解决方案COLMINA服务平台。

[1]第五代移动通信系统-3GPP(第三代合作伙伴计划)第五代系统的缩写。一种具有高速,大容量,超低延迟和多个同时连接的移动通信系统。

[2]压缩- 此技术采用国际标准H.265 / HEVC和现有的视频压缩方法。

免责声明:本文由用户上传,如有侵权请联系删除!