前言
本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇。快速回顾之后,本篇文章会更明确地集中于几个机器学习相关的任务集上。由于安全地跳过了一些基础模块——Python 基础、机器学习基础等等——我们可以直接进入到不同的机器学习算法之中。
第一步
机器学习基础回顾&一个新视角
上篇中包括以下几步:
- Python 基础技能
- 机器学习基础技能
- Python 包概述
- 运用 Python 开始机器学习:介绍&模型评估
- 关于 Python 的机器学习主题:k-均值聚类、决策树、线性回归&逻辑回归
- 关于 Python 的高阶机器学习主题:支持向量机、随机森林、PCA 降维
- Python 中的深度学习
如上所述,如果你正准备从头开始,我建议你按顺序读完上篇。我也会列出所有适合新手的入门材料,安装说明包含在上篇文章中。
然而,如果你已经读过,我会从下面最基础的开始:
机器学习关键术语解释,作者 Matthew Mayo。
地址:Machine Learning Key Terms, Explained
维基百科条目:统计学分类。
地址:Statistical classification
机器学习:一个完整而详细的概述
地址:Machine Learning: A Complete and Detailed Overview
Shai Ben-David 的机器学习介绍视频讲座
地址:http://suo.im/1TFlK6
理解机器学习:从理论到算法
地址:http://suo.im/1NL0ix
记住,这些介绍性资料并不需要全部看完才能开始我写的系列文章。视频讲座、教科书及其他资源可在以下情况查阅:当使用机器学习算法实现模型时或者当合适的概念被实际应用在后续步骤之中时。具体情况自己判断。
第二步
更多的分类
我们从新材料开始,首先巩固一下我们的分类技术并引入一些额外的算法。虽然本篇文章的第一部分涵盖决策树、支持向量机、逻辑回归以及合成分类随机森林,我们还是会添加 k-最近邻、朴素贝叶斯分类器和多层感知器。
Scikit-learn 分类器
k-最近邻(kNN)是一个简单分类器和懒惰学习者的示例,其中所有计算都发生在分类时间上(而不是提前在训练步骤期间发生)。kNN 是非参数的,通过比较数据实例和 k 最近实例来决定如何分类。
使用 Python 进行 k-最近邻分类。
地址:K-Nearest Neighbor classification using python
使用 Scikit-learn 进行文档分类
地