常见算法介绍
一、算法介绍举例:身高体重预测
使误差平方和最小,得出参数和样本值之间的关系
二、常见的机器学习算法分类
1.有监督学习
每个输入数据都有标记,教计算机学习,建立起模型判断测试样本
2.无监督学习
举例:
平时学习是有监督学习;考试是无监督学习
三、常见的机器学习算法分类
1.有监督学习算法
(1)分类
①内容
②种类
③分类算法重点
KNN
计算距离:
决策树
【纯度】:最后的结果是不是全部为:是或者否
【信息熵】:混乱性的增加
>【信息增益】:信息确定性的增加(熵值发生变化)
如果基于一个数据集,选择味道作为学习数据,判断属于哪种水果,因为味道提供的有效信息多
举例解释:
1)第一级:
特征选择选择年龄为最佳选择
2)第二级:
两个分支的整体熵为0,数据集不存在混乱
3)生成决策树:
(2)回归
2.无监督学习算法
(1)聚类算法:探索性分析
①聚类算法:K-Means
1)确定聚类中心
2)计算距离,归类
3)更新聚类中心位置
重复第二三步骤,直到聚类中心不再发生变化
(2)关联规则
3.半监督学习算法
(1)Bagging
多个模型叠加增大正确率:
(2)Boosting
把每次数据集错误的部分权值增大,再次训练,重复提取争取的权值,得到模型
举例:
AdaBoost
Smart Bagging: