大数据与人工智能在开发中，需要注意哪些要点？

最新推荐文章于 2023-07-09 16:23:52 发布

人工智能爱好者

最新推荐文章于 2023-07-09 16:23:52 发布

阅读量1k

点赞数

分类专栏：人工智能文章标签：大数据开发人工智能开发

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhinengxuexi/article/details/89044626

版权

注意点1：你的数据未必可靠

在实际应用中，有很多各种各样的原因会导致你的数据是不可靠的。因此，当你将数据用于解决问题前，必须经常留心来检查数据是否值得信赖。

如果基于糟糕的数据来挖掘，无论多么聪明的人也永远只会获得糟糕的结果。

下面列举了一些常见的可导致数据可靠性问题的因素：

·用于开发的数据，往往和实际情况下的数据分布不同。例如也许你想把用户按照身高划分为“高”、“中等”、“矮”三档，但如果系统开发时使用的数据集里最低用户的身高是6英尺(184cm)，那么很有可能你开发出来的系统里会把一个“仅有6英尺”的用户称为“矮”用户

·你的数据集中存在很多缺失数据。事实上，除非是人为构造的数据集合，否则很难避免缺失数据问题的发生，如何处理数据缺失的问题是很有技巧的事情。实践中我们要么是干脆丢弃一部分残缺的数据，要么就是想办法计算一些数值去填补这些缺失值。无论哪种方法都可能导致应用结果的不稳定

·你的数据可能随时在变化。数据库的表结构可能会变，数据定义也可能会变

·你的数据可能没有被归一化。假设你可能在观察一组用户的体重，为了能够获得有效的结论，首先需要对每个体重的衡量单位进行归一化，是英镑还是公斤，不能混淆着用

·你的数据可能并不适用于相应的算法。数据存在着各种各样的形式和规范，或者叫数据类型(datatypes)，有些是数值化的数据，有些则不是。有些数据集合能被有序排列，有些则做不到。有些是离散化的数据(例如房间里的人数)，另一些则是连续化的(例如气温或者气压等数据)

注意点2：计算难以瞬间完成

完成任何一个人工智能解决方案的计算，都需要一定的时间，方案的响应速度，对商业应用的成功与否起到十分关键的作用。

不能总是盲目假设

最低0.47元/天解锁文章

人工智能爱好者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据与人工智能在开发中，需要注意哪些要点？

注意点1：你的数据未必可靠在实际应用中，有很多各种各样的原因会导致你的数据是不可靠的。因此，当你将数据用于解决问题前，必须经常留心来检查数据是否值得信赖。如果基于糟糕的数据来挖掘，无论多么聪明的人也永远只会获得糟糕的结果。下面列举了一些常见的可导致数据可靠性问题的因素：·用于开发的数据，往往和实际情况下的数据分布不同。例如也许你想把用户按照身高划分为“高”、“中等”、“矮”三档，但如果系统...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。