密歇根大学的一家初创公司Voxel51今天推出了其旗舰产品-一种软件平台,旨在使人们能够更轻松,更快,更实惠地访问未开发的视频数据潜力。
该软件针对的是使用视频但难以从中提取所需信息的公司。尽管视频是一种丰富的数据形式,但由于其复杂性,大文件大小以及缺少诸如单词之类的已定义单位,因此很难对其进行分析和搜索。
Voxel51已着手通过其视频分析平台和开源软件库克服这些障碍,这些软件库可共同实现最新的视频识别。它标识并遵循每个剪辑中的对象和动作。正如联合创始人Brian Moore所说:“我们将视频转化为价值。”
他们最初关注的重点是无人驾驶汽车,主要关注道路场景和公共安全方面的录像。在这两种应用中,相机都是关键传感器,但是人类处理数据以使计算机可以对其进行分析非常耗时。更快,自动化的处理应加快更好的计算机视觉的开发。
电气和计算机工程学教授联合创始人Jason Corso说:“这是第一个也是唯一一个公开的道路场景理解平台。”“汽车公司正在建造它们,但使用的是专有仓库。我们的汽车将可供任何人使用和尝试。
“通过使视频处理民主化并访问大型的带注释的库,我们使年轻的初创公司能够与资源丰富的团队竞争,这些团队致力于大型公司的无人驾驶汽车和其他计算机视觉应用。”
在当今的无人驾驶车辆中,感知算法是使用机器学习技术生成的,这意味着它们需要在带有对象识别和跟踪注释的视频剪辑上进行训练,例如,行人,车辆,路灯柱,标志和交通信号灯。
在对系统进行培训之前,必须对视频进行注释(通常是人工注释)。这就是为什么为机器学习算法创建训练数据既费时又昂贵的原因。
借助Voxel51,用户可以依靠平台的AI软件来加快此过程的速度。然后,可以搜索非常具体的视频内容,例如,walk狗。借助开源库,一些用户可以访问比他们原本无法承受的更大的数据集。
UM Tech Transfer许可总监Bryce Pilz说:“对于Voxel51在自动车辆领域开发的尖端AI技术存在明显的需求,我们对已经取得的进展充满热情。 。
“目前,Voxel51技术正在帮助Mcity的自动驾驶汽车了解他们在路上看到的东西,以便他们做出更好的决策,而且毫无疑问,我们最终将看到这些创新将其应用于量产汽车,使它们更加安全,高效和可靠。”
除了将强大的AI视频分析交给开发人员之外,Voxel51的主要内在差异在于,其处理工作在跨帧的时空体积中进行,它们可以捕获随时间变化的运动和外观。换句话说,他们不是在看像素而是在看像素。
该公司已经筹集了200万美元的风险投资。Corso说,它位于安阿伯(Ann Arbor),拥有15名员工,并且正在招聘更多人。
“从现代计算的曙光开始,人类一直在适应计算机。我认为现在是计算机开始适应我们的时候了,这需要对视觉世界有更深入的了解,” Corso说。“ Voxel51的新平台是朝这个方向迈出的重要一步。我们希望使新公司能够轻松,强大地添加视觉感知功能,而这是他们本来无法做到的。”