学习机器学习过程中的笔记
机器学习应用领域及应用范围不可小觑,值得学习,值得分享,后期根据学习进度同步更新;
机器学习基础
简单的说,机器学习就是把无用的数据转换成有用的信息
监督学习与无监督学习
监督学习
分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。
无监督学习
数据没有类别信息,也不会给定目标值。
- 在无监督学习中,将数据集合分类成由类似的对象组成的多个类的过程被称为聚类
- 将寻找描述数据统计值的过程称之为密度估计
- 此外,无监督学习还可以减少数据特征的维度,以便使用二维或三维图形更加直观的展示数据信息
用于执行分类,回归,聚类和密度估计的机器学习方法
监督学习的用途
监督学习的用途: | |
---|---|
k-近邻算法 | 线性回归 |
朴素贝叶斯算法 | 局部加权线性回归 |
支持向量机 | Ridge回归 |
决策树 | Lasso 最小回归系数估计 |
无监督学习的用途
无监督学习的用途: | |
---|---|
K-均值 | 最大期望算法 |
DBSCAN | Parzen窗设计 |
选择合适的算法:
监督学习:
- 预测目标变量的值,使用监督学习算法
确定目标变量类型:
-
如果目标变量是离散型的,可以选择分类算法
-
如果目标变量是连续型的 ,可以选择回归算法
无监督学习:
- 不想预测变量的值,使用监督学习算法
确定是否需要将数据划分为离散的组:
- 如果是唯一的需求,则是用聚类算法
- 如果还需要数据与每个分组的相似程度,则需要使用密度估计算法
开发机器学习应用的步骤
(1)收集数据
(2)准备输入数据
(3)分析输入数据
(4)训练算法
(5)测试算法
(6)使用算法