机器学习 – 《机器学习》(周志华) 第三章
笔记
-
正交回归
点距离线的距离是正交回归 -
线性回归
点垂直方向到线的距离 -
将离散特征转为线性公式
-
极大似然估计
- 用途:估计概率分布的参数值
- 方法:
- 写出随机变量X的概率密度函数
- 写出似然函数
- 求出使得L(μ,σ^2) 取到最大值的μ,σ
-
概率密度函数
-
最小二乘法
基于方误差最小化来进行求解的方法 -
凸集1
凸函数时需要,最优化领域凹凸性与高数中不同 -
梯度
梯度为 多元 函数的一阶导数 -
线性判别分析
给定训练集,将样例进行投射。同类型的样例点尽可能接近,不同的样例尽可能远;在对样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定新样本的类别 -
多分类学习
- 思路:利用“拆解法”将多分分类任务拆解为多个二分类任务,逐一解决的一种思路
- 常用拆分策略
- 一对一 OvO
- 一对其余 OvR
- 多对多 MvM
-
ECOC(Error Correcting Output Codes) 纠错输出码
是MvM 常用技术,是将编码的思想引入类别拆分,并尽可能在解码过程中具有容错性
注
常用数学符号
使用搜狗输入法可直接输入
- alpha —— α
- beta —— β
- gamma —— γ
- theta —— θ
- eta —— η
学习凸集,推荐 《最优化基础理论与方法》(王燕军) ↩︎