如何学好数据挖掘(二)

13825820-fef55996fbed66a9.jpg

在上一篇文章中我们给大家介绍了学习数据挖掘的第一条路线,第一条路线讲述的是如何学习机器学习的第一部分,主要是数据挖掘方面,懂得了这些我们才能够进行下一步的工作,那么学习数据挖掘的第二条路线是什么呢?我们在这篇文章中给大家介绍一下相关的知识。

首先给大家说一下数据挖掘的技术过程,数据挖掘的技术过程有很多,比如数据清理(消除噪音或不一致数据)、数据集成(多种数据源可以组合在一起)、数据选择(从数据库中提取与分析任务相关的数据)、数据变换(数据变换或统一成适合挖掘的形式;如,通过汇总或聚集操作)、数据挖掘(基本步骤,使用智能方法提取数据模式)、模式评估(根据某种兴趣度度量,识别提供知识的真正有趣的模式)、知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。

然后给大家说一下数据挖掘的第二条路线,就是K-means,然后是EM,然后是朴素贝叶斯,然后是贝叶斯网络,然后是隐马尔科夫模型(基本模型,前向算法,维特比算法,前向-后向算法),然后是卡尔曼滤波。这条线路所涉及的基本都是那些各种画来画去的图模型,一个学术名词是 PGM。这条线的思路和第一条是截然不同的!贝叶斯网络、HMM(隐马尔科夫模型),K-means 和 EM 具有与生俱来的联系,认识到这一点才能说明你真正读懂了它们。而EM算法要在HMM的模型训练中用到,所以我们要先学EM才能深入学习HMM。所以尽管在EM中看不到那种画来画去的图模型,但还把它放在了这条线路中,这也就是原因所在。朴素贝叶斯里面的很多内容在,贝叶斯网络和HMM里都会用到,类似贝叶斯定理,先验和后验概率,边缘分布等等(主要是概念性的)。最后,卡尔曼滤波可以作为HMM的一直深入或者后续扩展。尽管很多有的书里没把它看做是一种机器学习算法(或许那些作者认为它应该是信号处理中的内容),但是它也确实可以被看成是一种机器学习技术。很多科学家也深刻地揭示了它与HMM之间的紧密联系。

关于数据挖掘的学习路线我们就给大家介绍到这里了,想必大家看了这篇文章以后已经知道了数据挖掘怎么学习了吧?大家在进行学习数据挖掘的时候还是要根据自己的进度进行学习,这样才能够得出一个极好的效果。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值