过来人介绍怎样学习数据挖掘

chanet:

 

      数据挖掘(DM: Data Mining)的思想最初来源于统计学,属于数据分析,而不是计算机,不过现在分两块: 理论型(统计学),实践型(计算机); 而现在两个专业都有数据挖掘专业的研究生,都是从不同的方面入手. 计机的学生啃统计学原理,时序/多元分析等,概计之类的数据理统计知识; 统计学的兄弟啃计算机的数据库原理等...互相学习...

      如果你从计算机方面入手,那可以看一些数据挖掘的书,而大部分以数据仓库(Data Warehouring)为主,一些比较计算机专业的东西,都是建在数据库上.而IT业发展迅速,数据库厂商就大炒BI(商业智能)概念,加上一些厂商都推自己的产品,互抄互炒...  而就业市场上都是一些BI实施的工作,做BI的公司帮客户整成(ETL)数据到数据仓库,之后套一些DM的算法,加上前端漂亮的显示... 再用SPSS,SAS来按主题(Subject)来计算等...

      而统计学入手呢,就是系统的数据分析了,如果你之后看过计算机方面的数据仓库与数据挖掘的书的话,里面的一章就相当于统计学的一门课(如:时间序列分析), 计算机方面只把统计学精华方面溶过去~ 而统计学更注重的统计分析, 与其说以理论为基础, 不如说以模型和数据为基础, 模型与数学为基础....(不深入了)...

      最后说说市场吧, 市场以利益为主~  无论计算机还是统计学的应用的目的就是辅助业务发展. 而不同的行业有不同的做法, 但都离不开: 数据处理(收录) -> 数据统计与分析, 就目前的BI来说,分为: ETL->DW->OLAP/Data Mart -> DM; DM是最后一节, 挖之前要有模型, 大厂商都有很成熟的模型架构(如:银行用NCR的, 保险用IBM 的IIW); 系统模型之上的就是知识模型,之后就是用DM算法去找规则了(如:在CRM系统里找一批忠诚客户, 怎才算忠诚呢? 这就需定义了,像:30天内消费29次算不算忠诚? 这些都是一些理论,最后加上计算机技术,就可以很快很自动地生成报表给管理层人员了)

      说多了,不知是否离题,反正让你理解多点吧. 不要单独学了一些DM的软件(SPSS/SAS)和理论. 有时间就从大体入手, 了解整体,知道什么来的,怎么用,最关键学了是否对自己有用,是否是自己的兴趣等. 之后深入某一个你有兴趣的环节,当然你可以全部精通,全才呀~ 呵呵

      偶目前在国内最先开始BI的公司担任数据仓库工程师. 做BI之前做过几年业务系统开发,熟悉Oracle,曾经做过DBA(9i OCP); 以上是偶的见解,欢迎楼下拍砖. 哈~


  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值