代理商正处于到达2022年底美国国家档案局(National Archives and Records Administration)电子记录截止日期的旅程的各个阶段。实际上,在最近的数字政府学院电子发现,记录和信息管理虚拟会议上,活动组织者调查了让观众了解参与者在数字化转型工作中的进展。毫不奇怪,结果甚至在“取得进展”,“我们还有很长的路要走”和“别问”之间平均分配。在与政府机构的讨论中,我们发现了类似的观点。
无论代理机构在电子记录管理过程中处于何处,都应利用这一机会来部署可以从该信息中获取见解的功能。然而,这是说起来容易做起来难,因为大多数机构都在努力发掘其信息的价值。他们拥有太多的非结构化和未分类的信息,或者缺乏内部资源和分析这些信息的技能-或两者兼而有之。
NARA的最后期限要求所有机构记录必须在2022年底之前达到100%数字化。当今的分布式机构环境的特征是系统多样化,系统具有来自各种数据源的多种数据类型,包括物理和数字信息。这使负责执行NARA电子记录管理要求的机构记录管理者感到头疼。但是,借助支持AI和ML的内容分析,数据管理和信息治理工具来对物理和数字内容进行分类,提取和丰富,代理商可以成功地克服这些难点。
在数字化转型过程中,将AI和ML功能集成到代理商的信息管理程序中,将使他们能够自动分类,提取和丰富物理和数字内容。从高层次看,三步过程如下所示:
输入记录–系统使用光学字符识别,图像识别和视频处理功能来提取信息并将其保存为电子格式。
应用AI / ML –通过将分类过程和实体提取与AI / ML策略结合使用,系统将自动训练模型,应用模型,捕获反馈并为下一阶段准备数据。
输出–数据准备好后,将其导出到数据可视化功能中,该功能使代理商可以搜索,分析,查看和生成更深刻的见解,从而根据该信息做出更好的决策。
AI / ML方法的好处
在数字化转换和简化记录管理流程方面,合并AI / ML的特定好处包括:
用于搜索和跟踪的元数据。元数据标记是数字化过程的一部分,可帮助机构正确地分类,搜索和管理信息。元数据对于在其整个生命周期中管理,访问和最终跟踪信息至关重要。与AI / ML结合使用时,元数据可以提供有关代理记录的重要信息,例如内容是什么以及它具有什么特征。
从多个来源提取数据。AI / ML系统可帮助机构从孤立的来源中获取信息,并通过类型和关联的元数据对每条信息进行分类。
数据分类。AI / ML解决方案中有监督学习和无监督学习的结合有助于避免在这些系统自动查找,分离和了解数据中任何意外文档类时了解所有文档类的需求。此过程训练连接到AI / ML平台的神经网络,以便一旦完成文档和元数据索引编制,便会建立基线库,然后可以在基线库中搜索模式和趋势。
用于可视化的用户界面。增加以通用格式查看/可视化信息的功能,可以提高整个机构的责任感和透明度,同时为决策者提供更多有价值的数据。
持续改进。AI / ML系统不断使用人工校正等人工信号来改善电子学习,以提供更准确的结果。
尽管将所有记录转换为数字格式的过程可能令人生畏-尤其是考虑到代理机构管理的记录的数量和种类繁多,但它确实为代理机构提供了从该信息中获取价值的机会。通过将AI / ML技术整合到他们的记录管理程序中,代理商可以在其信息中释放这种潜力,以帮助做出更好,更明智的决策并增强他们所提供的全面服务。