您的位置:首页>AI>

您的客户如何开始他们的AI旅程

社交媒体和网站上的新闻中到处都有AI。与大多数技术都处于炒作周期一样,市场上有很多噪音,很难确切地了解什么是人工智能以及政府机构如何使用它。

简而言之,人工智能是一组统计和数学算法,它们使用大量的历史数据来学习并做出对未来的预测。

十多年来,人工智能已经融入我们使用的许多事物之中。一些流行的用例示例包括Gmail中极其精确的垃圾邮件过滤器,Microsoft Outlook将电子邮件分为混乱,集中的流和其他流,Google助手,Siri,Alexa,Netflix,亚马逊和Tesla自动驾驶仪(最新版本使用机器学习来感知并同时打开雨刷器)。

但是,人工智能的增长取决于良好的数据。我们需要高质量的数据来训练AI模型。IT系统对公司和代理机构都是一个福音,将其从纸面和人力密集型任务的世界转移到更自动化的系统,自助服务以及总体上更高水平的客户和公民服务。

但是,随着IT系统的成长和发展,它们通常朝着独立的方向发展。代理商甚至没有简单的数据分类标准,例如一个人的姓名或地址。例如,卫生和公共服务采购系统对合同“授予”有11个不同的条款。通过IRS合同,我们了解到,在一个系统中,一个名为“国家”的字段并未引用我们可能想到的内容-该国的50个州,而是其他州。这并非政府机构独有,但在大型私营企业中也很常见。

为了克服炉灶式数据的泛滥,一种常见的解决方案是构建大型“数据仓库”,该仓库将来自多个系统的信息整合到一个数据库系统中。不幸的是,当移动数据时,它可能会以不希望使数据变得毫无用处的方式被破坏,破坏,更改或无法撤消地转换。

在交易系统和数据仓库中,都存在许多数据质量问题,包括数据重复,数据不正确,数据损坏等。当输入数据有缺陷时,将导致GIGO问题或垃圾进,垃圾出。

代理商面临的另一个严重问题是整个企业中的数据碎片以及生活在孤岛中的数据通常是无法访问的。大多数机构系统是在独立的方向上开发的,通常侧重于运行组织一部分的任务功能。例如,纳税人可能由多个孤立的系统处理,这些系统处理工资和收入信息,审计,执行或刑事调查。很难对所涉及的主要实体进行360度查看:存在于这些系统中的纳税人。系统所有者还热衷于保护其系统中的数据,因此获取访问权通常很乏味且充满挑战。

这些是严重的问题。为了获得我们可以依靠的结果,我们至少需要一定数量的质量合理的良好数据。这是否意味着在首先清理,标准化和合并我们拥有的所有数据之前就不可能有AI?

免责声明:本文由用户上传,如有侵权请联系删除!