logistic回归和广义线性模型

最新推荐文章于 2023-07-24 17:57:03 发布

weixin_30883777

最新推荐文章于 2023-07-24 17:57:03 发布

阅读量180

点赞数

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/frog-ww/archive/2013/01/06/2846955.html

版权

logistic回归：

　　logistic回归一般是用来解决二元分类问题，它是从贝努力分布转换而来的

　　h_θ(x) = g(z)=1/1+e^-z;z=θ^Tx

　　最大似然估计L(θ) = p(Y|X;θ)

　　　　　　　　　　 =∏p(y⁽ⁱ⁾|x⁽ⁱ⁾;θ)

　　　　　　　　　　 =∏(h_θ(x))^y(i)(1-h_θ(x))^1-y(i)

l(θ) = logL(θ)

=Σy⁽ⁱ⁾logh_θ(x⁽ⁱ⁾)+(1-y⁽ⁱ⁾)log(1-h_θ(x⁽ⁱ⁾))

　 θ的优化目的就是让最大似然估计最大，用梯度上升法求θ

　　θ_j=θ_j+α∂l(θ)/∂θ_j=θ_j+α(y⁽ⁱ⁾-h_θ(x⁽ⁱ⁾))x⁽ⁱ⁾_j

　　logistic回归用梯度上升法求得的θ的迭代公式看起来跟线性回归很像，但这跟线性回归是有本质区别的

　　1.线性回归是由高斯分布推导而来，而logistic回归是由贝努力分布推导而来

　　2.二种回归的最大似然估计是不一样的，只不过求完导后的结果看似相同

3.二种回归h_θ(x)是不同的

广义线性模型：

　　之前已经写了线性回归和logistic回归，基本的形式都是先设定h_θ(x)，然后求最最大似然估计L(θ),然后求出l(θ)=logL(θ),然后用梯度上升法或其它方法求出θ，二种回归如此想你的原因就是在于它都都是广义线性模型里的一员。

　　如果一个概念分布可以表示成p(y;η)=b(y)exp(η^TT(y)-a(η))时，那么这个概率分布可以称之为指数分布

　　贝努力分布转换为指数分布：p(y;ø)=ø^y(1-ø)^1-y

　　　　　　　　　　　　　　　　　　 =exp(log(ø^y(1-ø)^1-y))

　　　　　　　　　　　　　　　　　　 =exp(ylogø+(1-y)log(1-ø))

　　　　　　　　　　　　　　　　　　 =exp((log(ø/(1-ø)))y+log(1-ø))

　　根据上面指数分布的公式可得出：

　　　　　　　　　　　　　　　 b(y)=1

　　　　　　　　　　　　　　　 η=logø/(1-ø);ø=1/(1+e^-η)

　　　　　　　　　　　　　　　 T(y) = y

　　　　　　　　　　　　　　　 a(η)=-log(1-ø)

　　高斯分布转换为指数(因为σ的取值对最后的结果没影响，所以设σ²=1)：p(y;μ)=(1/2π)exp(-1/2(y-μ)²);2π上有根号

=(1/2π)exp(-1/2y²).exp(μy-1/2μ²)

　　根据上面指数分布的公式可得出：

　　　　　　　　　　　　　　　 b(y)=(1/2π)exp(-1/2y²);2π上有根号

η=μ

T(y) = y

a(η)=1/2μ²

　　广义线性模型的三步是：
　　　　　　　　1.将y|x;θ变换成以η为参数的指数分布的形式

　　　　　　　 2.因为h(x)=E[y|x],所以能过第1步的变换可以得到E[y|x]与η的对应关系(对于logistic回归，期望值是ø，ø与η的关系是ø=1/(1+e^-η)；对于线性回归，期望值是μ，μ与η的关系是η=μ)

　　　　　　　　3.设定η=θ^Tx(如果η是一个向量值的话，那么η_i=θ_i^Tx)

转载于:https://www.cnblogs.com/frog-ww/archive/2013/01/06/2846955.html

weixin_30883777

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
logistic回归和广义线性模型

logistic回归：　　logistic回归一般是用来解决二元分类问题，它是从贝努力分布转换而来的　　hθ(x) = g(z)=1/1+e-z ;z=θTx　　最大似然估计L(θ) = p(Y|X;θ)　　　　　　　　　　 =∏p(y(i)|x(i);θ)　　　　　　　　　　 =∏(hθ(x))y(i)(1-hθ(x))1-y(i) l(θ) = logL(θ)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。