巴拿马文件是新闻史上最大的泄密事件,数百名调查记者在过去的几年中分析了1,150万份文档,以产生以数据为主导的故事。
如今,当Microsoft试图解决数据新闻业的这一痛点时,情况可能会有所不同。它的新工具-Content Insights和Discovery Accelerator或IDA-可以在几秒钟内分析成千上万的文档或长镜头。
IDA将人工智能,物体视觉和光学字符识别(OCR)结合在一起,可以分析页面并提取文本,图像和其他关键数据。它还可以帮助记者搜索长视频,识别人脸或关键字,并提供可搜索的素材记录。
数据集
您可以使用IDA自己分析文档,也可以创建一个协作团队(使用“投资组合”功能)来进行相同的调查,并对共享项目发表评论。如果选择“私人”设置,则只有您可以看到您的数据库,而“公共”设置将允许您组织中的任何人查看您的工作。
IDA不仅可以帮助您在数据集的每个页面上找到一个名称(以黄色突出显示),还可以帮助您了解其功能的频率以及与之关联的其他名称。
您也可以单击灰色的关键字以从Bing搜索其他上下文或定义。尽管这有其局限性,但它可能是开始探索一个陌生主题的好地方。