数据挖掘该怎样的学习路线?

数据挖掘是一门综合类的学科,它综合了计算机、人工智能、统计学、数据库等领域的知识。建议你现从基本的数据挖掘算法开始学起,了解基础知识,数据预处理,基本的分类聚类算法还有关联规则的发现。以后要往哪个方向发展就看机会和兴趣了,比如中文信息处理,社区发现与规划,主题发现分类,自然语言理解等等。算法是最重要的!
个人建议如下:
第一阶段:掌握数据挖掘的基本概念和方法。先对数据挖掘有一个概念的认识,并掌握基本的算法,如分类算法、聚类算法、协同过滤算法等。 参考书:《数据挖掘概念和技术》(第三版)范明,孟小峰 译著。
第二阶段:掌握大数据时代下的数据挖掘和分布式处理算法。现在已经进入大数据时代,传统的数据挖掘算法已经不适用于
参考书:《大数据:互联网大规模数据挖掘和分布式处理》 王斌 译著。
第三阶段:使用Hadoop进行大数据挖掘。Hadoop里面有一个Mahout组件,几乎包括了所有的数据挖掘算法,包括分类、聚类、关联规则等。
参考书:Hadoop实战(第二版).陆嘉恒 著等。
另外,数据挖掘是数据库技术、人工智能技术、机器学习技术、统计学习理论、数据可视化等一系列技术的综合,所以,要想学好数据挖掘,这些技术也得懂的呀。 推荐入门时先看浙江大学王灿老师的数据挖掘课程,网上搜下。 期待与你一起学习数据挖掘,共同揭开数据之美。

相关视频:
浙大王灿老师的数据挖掘视频,比较基础,适合入门,教材是《数据挖掘-概念与技术(第二版)》;
中科院研究生院有两套视频,即数据挖掘引论和数据挖掘高级技术(39讲),后者可以作为数据挖掘的提高课程~
另外,模式识别、贝叶斯网络、高级人工智能、统计机器学习理论、数据库技术等视频都可以作为数据挖掘的拓展课程~

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值