数据挖掘需要掌握的技能

  1. 工程能力
    ( 1 )编程基础:需要掌握一大一小两门语言,大的指 C++ 或者 Java ,小的指Python 或者 shell 脚本;需要掌握基本的数据库语言;
    建议:MySQL + python + C++ ;语言只是一种工具,看看语法就好;
    推荐书籍:《C++ primer plus 》
    ( 2 )开发平台: Linux ;
    建议:掌握常见的命令,掌握 Linux 下的源码编译原理;
    推荐书籍:《Linux 私房菜》
    ( 3 )数据结构与算法分析基础:掌握常见的数据结构以及操作(线性表,队,列,字符串,树,图等),掌握常见的计算机算法(排序算法,查找算法,动态规划,递归等);
    建议:多敲代码,多刷题;
    推荐书籍:《大话数据结构》《剑指 offer 》
    ( 4 )海量数据处理平台: Hadoop ( mr 计算模型,java 开发)或者 Spark ( rdd 计算模型, scala开发),重点推荐后者;
    建议:主要是会使用,有精力的话可以看看源码了解集群调度机制之类的;
    推荐书籍:《大数据 spark 企业级实战》
  2. 算法能力
    ( 1 )数学基础:概率论,数理统计,线性代数,随机过程,最优化理论
    建议:这些是必须要了解的,即使没法做到基础扎实,起码也要掌握每门学科的理论体系,涉及到相应知识点时通过查阅资料可以做到无障碍理解;
    ( 2 )机器学习 / 深度学习:掌握 常见的机器学习模型(线性回归,逻辑回归, SVM ,感知机;决策树,随机森林, GBDT , XGBoost ;贝叶斯, KNN , K-means , EM 等);掌握常见的机器学习理论(过拟合问题,交叉验证问题,模型选择问题,模型融合问题等);掌握常见的深度学习模型( CNN ,R
  • 19
    点赞
  • 146
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值