近年来,各个业务领域对视频数据的AI分析的需求急剧增加。尤其是第五代移动通信系统的普及,预计将导致摄像机捕获的超高清视频图像以及街头和生产线上捕获的许多图像爆炸性增长。
在开发这项新的压缩技术时,富士通专注于AI和人类识别图像的方式上的重要差异。即,在识别视频数据中的人,动物或物体时,人工智能和人类在图像区域上往往有所不同,而图像区域在强调判断时很重要。富士通已开发出一种技术,可以自动分析AI重视的领域,并将数据压缩到AI可以识别的最小大小。这使得可以分析大量视频数据而不会损害识别精度,同时可以大大降低操作和数据传输成本。还可以预期,该技术将允许用户通过组合存储在云中的多个视频数据,传感器数据和性能数据(例如销售数据)来分析更高级的视频数据。
背景与挑战
近年来,使用AI分析图像的技术发展迅速,并有望成为许多行业中许多公司进行数字化转型的驱动力之一。随着2020年复杂的5G移动服务的到来,对AI分析的需求预计会进一步增加,同时超高清4K和8K摄像机以及大量视频数据在包括行为分析在内的应用中的使用也将增加。制造业和零售业。
尽管如此,对于用于图像分析的深度学习技术的处理要求仍提出了相当大的挑战。一种确保处理这些任务的计算能力的有效技术是与云一起处理,但是由于视频数据通常非常占用资源,因此需要一种可以将所有视频数据传输到云的高压缩技术。而不会影响质量,从而不会使网络带宽过载。
压缩视频会根据压缩率降低图像质量,并且如果AI聚焦的区域过度压缩,识别精度会降低。富士通开发了一种视频压缩技术,该技术可以自动分析一帧视频数据图像中被AI识别为判断材料的物体的区域,以每个区域识别所需的最低图像质量对图像进行压缩(2)(图1)。与传统的压缩技术相比,通过应用此技术,可以显着减小视频数据的大小,同时保持识别精度。
自动估算压缩比而不影响AI识别精度的技术。针对每个区域分析了压缩特有的图像质量下降对识别精度的影响。根据AI识别结果自动估算不影响识别精度的压缩比。
当改变整个图像的压缩比并改变图像质量时,通过汇总对识别结果的影响来确定所有区域中AI在识别过程中特征的重要程度。将紧接在每个区域中的识别精度迅速恶化之前的压缩率估计为不影响识别精度的压缩率。