#链接: http://blog.csdn.net/longxinchen_ml/article/details/50749614.
http://blog.csdn.net/han_xiaoyang/article/details/50759472
文章是简单版的学习路线图;
理论+实践才是能否学会的关键点;
其他需要的资源,需要的时候再找,毕竟从入门到放弃从来都不是因为找不到资源。
机器学习路线图
理论基础
机器学习基础
问题种类
分类问题:提取特征判别结果
回归问题:预测结果
聚类问题:样本数据自动分类
机器学习的典型方法
【分类】
逻辑回归、支持向量机、随机森林、朴素贝叶斯、深度神经网络等
【回归】
线性回归、最小二乘法、逐步回归
【聚类】
K-means、密度聚类
数学基础
微积分
线性代数
概率与统计
实践
编程
语言:Python
库:scikit-learn、libsvm
深度学习框架:Tensorflow、Keras
操作系统:Linux、 windows+Anaconda
大数据相关: Hadoop、 Spark
基本流程
1.数学建模: 将问题抽象成数学问题
2. 获取数据:数据的质量方面要具有代表性、数量方面要对量级进行评估
3. 特征处理: 预处理( 归一化、离散化、因子化、缺失值处理、去除共线性)、特征选择( 相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等)
4. 模型的训练和调优:理解算法超参数的意义
5. 模型诊断: 过拟合/欠拟合;误差分析
入门项目
分类
鸢尾花分类
Emojify –使用Python创建自己的表情符号
MNIST数字分类机器学习项目
回归
股价预测
聚类
对消费群体进行细分
【最后附上思维导图版路线】