西瓜书阅读笔记 话不多说 开始吧~
线性模型
线性回归
dataset
D=(x¯1,y1),(x¯2,y2),...,(x¯m,ym)
,
x¯i=(x¯i1;x¯i2;...;x¯id)
. 试图获得一个线性模型去预测
yi
假设d=1 => f(
wxi+b
) 使得
f(xi)≈yi
如何确定
w
和
均方误差===>最小二乘法:
∂E(w,b)∂w∂E(w,b)∂b
对数几率回归
写作logistic regression,虽是regression却是分类。是用线性模型去逼近真实标记的对数几率。
考虑二分类问题,其输出标记y∈{0,1},以输出0.5为分类。
y为预测值,1-y为另一类预测值。y/(1-y)则是相对概率,取对数,我们就用线性模型去近似这个~
lny1−y=wT+b
可得
y=11+ewTx+b
这样理解logistic regression还是给人 哇~ 的感觉。
类别不平衡
- 去掉些反例
- 重复正例
- y’/(1-y’)=y/(1-y)*m-/m+ 进行再缩放