数据质量对于成功的AI/ML建模的重要性

数据质量对于AI和ML的成功至关重要。不良数据会导致分析和结果不佳,66%的受访者认为数据质量差影响了AI/ML部署。数据质量包含缺失和错误两方面,非结构化数据的处理是挑战。移动应用可以提高数据质量,减少错误,无纸化流程有助于降低不良数据成本。
摘要由CSDN通过智能技术生成

人工智能 (AI) 和机器学习 (ML) 技术有可能彻底改变许多行业。但 AI 和 ML 有一个鲜为人知的致命弱点。Refiniv在2019年“更聪明的人类、更聪明的机器:人工智能/机器学习全球研究”中进行的一项研究表明,部署和采用人工智能和机器学习的最大障碍是数据质量差。来自替代资源和非结构化数据的数据正变得越来越重要,但在它们的见解变得真正有价值之前必须对其进行“提炼”。 

“garbage in, garbage out”这句话适用于 AI/ML 部署——如果你给模型提供坏数据,分析和结果也会低于标准。根据 Refiniv调查,66%的受访者表示,糟糕的数据质量会影响他们部署机器学习和人工智能技术的能力。该报告还表明,在ML模型中处理新数据的四个挑战中的三个与数据质量有关。这些挑战包括有关数据历史、覆盖范围和总体的准确信息,识别不完整或损坏的记录,以及清理和管理数据。数据科学家面临的最大挑战之一是找到高质量的数据,因为他们必须花费 80-90% 的时间来清理和标准化不良数据。

01

为什么数据质量很重要?

在进行数据分析时,无论是否用于人工智能,数据质量都极为重要。数据质量有两个组成部分:

1.缺失数据

2.数据不正确

这两方面都存在很大问题,每个问题的影响只能根据具体情况来确定。如果ML模型中不支持数据质量,则会导致误解和错误推断。研究表明,公司在分析自己的公司数据的同时,也会分析市场数据和非结构化数据&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值