标签中的真相是商业管理中的一个强有力的概念。它可以确保消费者确切地知道他们所得到的东西,可能的警告和忠告以及如果他们以制造商不认可的方式使用产品,可能会带来什么风险。
到了时候,我们将标签的真相带给了正在大量商业产品中使用的人工智能标签。所需要的是一些标准化的方法,以使经过训练的已部署AI模型的精确来源透明化。同样重要的是,它需要全面披露已测试和认证了AI模型以适合其预期应用领域的各种环境,以及已在AI中确定的任何偏见和约束(无论是预期的还是其他的)。模型在现场或实验室环境中的实际表现。
人工智能已成为许多企业中的工业化流程,在可以使从数据准备到建模,培训和服务的每个流程自动化的工具上创造了高度优先级。标签或注释是一项关键功能,需要在AI开发和操作工作流的各个阶段执行。我们需要区分AI训练数据的标签-这是数据准备,建模和训练的重要部分-与标记所得的经过训练的AI模型。后一个功能可以提供关键的元数据,以用于监视,控制和优化经过训练的机器学习,深度学习,自然语言处理或其他AI模型在下游应用程序中的行为。
为了满足对训练有素的AI模型加标签的要求,Google最近发布了一个称为模型卡的元数据框架,该框架可用于声明针对特定用例进行了训练的机器学习模型的适用性,适当性和局限性。Google已向开发人员,政策制定者,用户和其他行业利益相关者开放的框架,描述了如何创建1-2页元数据文档的框架,这些文档预先声明了经过训练的AI模型是如何设计的,并且可能在其预期的用例中表现。与正在进行的项目的目标一致在AI行业合作伙伴联盟中,Google的框架为AI开发人员提供了一个词汇,可以在模型发布时提前声明:
用于构建它的算法
用于构建,训练和验证的源数据
用于培训并使其保持适合其预期目的的学习方法,过程和频率
拟在其中使用的上下文
产生最准确推断的数据类型
关于环境数据中各种扰动的推断精度的鲁棒性和公差
关于与特定受众群体相关的视觉和其他数据的推断中出现特定错误,异常或偏倚的可能性
它表现最佳和最一致的条件