目录
3.4线性判别分析(Linear Discriminate Analysis,LDA)
机器学习三要素:
模型——根据具体问题,确定假设空间;
策略:根据评价标准,确定选取最优模型的策略;
算法——求解损失函数,确定最优模型
注:西瓜书第3章学习的时候参考了南瓜书以及斯坦福吴恩达老师的课程。
3.1基本形式
线性模型的一般表达式
写成向量形式为
3.2线性回归
线性回归试图学得
南瓜书中用极大似然估计推出,可以通过让与
均方误差最小来作为性能度量,此时需要找到最优解
和
。求解
和b,使得
最小化的过程,称为线性回归模型的最小二乘“参数估计”(parameter estimation)。
多元线性回归中,则是由向量和矩阵来描述,x等。
下面贴出吴恩达课程的学习笔记:
3.3对数几率回归(逻辑回归)
虽然被称为回归,但是其实是解决分类问题。主要思想是找一个单调可微函数将分类任务的真是标记y与线性回归模型的预测值联系起来。
3.4线性判别分析(Linear Discriminate Analysis,LDA)
思想:给定训练样例集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近、异类样例的投影点尽可能原理;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定新样本的图例。
3.5多分类学习
拆分策略主要有:一对一(OvO)、一对其余(OvR)和多对多(MvM)
3.6分类不平衡问题
解决方法:
- 对较多的样本进行欠采样,代表性算法SMOTE(插值产生额外样例)
- 对较少的样本进行过采样,代表性算法EasyEnsemble(利用集成学习将样例分为若干个集合)
- 阈值移动