《机器学习》对数几率回归——笔记

最新推荐文章于 2024-07-30 01:28:06 发布

sunny_develop

最新推荐文章于 2024-07-30 01:28:06 发布

阅读量3.3k

点赞数 6

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guanyuqiu/article/details/84647347

版权

机器学习专栏收录该内容

7 篇文章 2 订阅

订阅专栏

对数几率回归不是回归函数而是分类函数。

广义线性模型 $y=g^{^{-1}}(w^{^{T}}x+b)$

提出问题：需要找到一个单调可微函数将分类任务的真实标记y与线性回归模型的预测值联系起来

线性回归预测值 $z=w^{^{T}}x+b$ ，应用于分类问题一般选用“单位阶跃函数”

$y=\left\{\begin{matrix}0,z<0 & \\ 0.5,z=0 & \\ 1,z>0 & \end{matrix}\right.$

但阶跃函数不连续，而对数几率函数正好可以替代阶跃函数，它单调可微，函数表达式为

$y=\frac{1}{1+e^{^{-z}}}$ 把线性模型代入得到

$y=\frac{1}{1+e^{^{-(w^{^{T}}+b))}}}$ (1)

根据对数形式进行更新变形为：

$ln\frac{y}{1-y}=w^{^{T}}x+b$ (2)

y视为样本x为正例的可能性，1-y则放映了做为反例的可能性。

利用对数几率回归进行分类的优点：

1.无需视线假设数据分布，避免了分布不准确所带来的问题；

2.不仅预测出类别，而且磕到近似概率预测；

3.任意阶磕到的凸函数，比较好优化；

下面推到怎样求模型中的w和b：

对于某一个分类任务，结果输出（0，1）

根据式子(1)中的y视为类后验概率估计 $p(y=1|x)$

则式子(2)可以写成： $ln\frac{p(y=1|x)}{p(y=0|x))}=w^{T}x+b$

与 p(y=1|x)+p(y=0|x)=1

组合解出：

$p(y=1|x) = \frac{e^{w^{T}x+b}}{1+e^{w^{T}x+b}}$

$p(y=0|x) = \frac{1}{1+e^{w^{T}x+b}}$

可以通过最大似然估计来计算w和b，给定数据集 $(x{_{i}},y{_{i}}){_{i=1}^{m}}$ ,对率回归模型最大化“对数似然”：

$L(w,b)=\sum lnp(y{_{i}}|x{_{i}};w,b)$

为了方便令 $\beta =(w;b),\grave{x}=(x;1)$ 则 $w^{^{T}}x+b$ 可简化为 $\beta ^{^{T}}\hat{x}$

再令

$p{_{1}}(\check{x};\beta )=p(y=1|\check{x};\beta )=\frac{e^{\beta ^{T}x{_{i}}}}{1+e^{\beta ^{T}x{_{i}}}}$

$p{_{0}}(\check{x};\beta )=p(y=0|\check{x};\beta )=1-p{_{1}}(\check{x};\beta )=1-\frac{1}{1+e^{\beta ^{T}x{_{i}}}}$

根据最大似然估计代入对数似然模型中得到

$L(w,b)=\sum(-y{_{i}}\beta^{T}x{_{i}}+ln(1+e^{\beta^{T}x{_{i}}})))$

上式是关于 $\beta$ 的高阶可导连续凸函数，根据凸优化理论，经典的数值优化算法如梯度下降法、牛顿法等求得最优解

算法思路：

关注

6
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

sunny_develop CSDN认证博客专家 CSDN认证企业博客

码龄14年

54: 原创

7万+: 周排名

83万+: 总排名

34万+: 访问

: 等级

2942: 积分

124: 粉丝

192: 获赞

111: 评论

904: 收藏

私信

关注

热门文章

分类专栏

文献 9篇
深度学习 10篇
语义分割 1篇
背景建模 3篇
目标跟踪 5篇
目标分类 4篇
图像增强 3篇
红外摄像 3篇
图像处理基础算法 9篇
python 12篇
Matlab 1篇
C++ 8篇
机器学习 7篇
caffe 1篇
tensorflow 1篇
目标检测 3篇

最新评论

《BBN:Bilateral-Branch Network with Cumulative Learning for Long-Tailed visual Recognition》简读
GG_B这孩子打小就聪明: 你好大佬，我想问一下，训练阶段，它不同的采样器采到不同的样本，最后在累计学习部分合起来分类，两个样本的标签不一样怎么分类的。感觉怪怪的。如果是同一个样本，不同的采样器又感觉没有意义了，刚看到这个论文，想借鉴，但是卡在这里，希望您可以解答。十分感谢！
Lime 代码
广东中学生: if __name__ == "__main__": result = model() result.load(os.getcwd()) # for i in range(4,5): # img = os.path.join(os.getcwd(),"miccai/{}.png".format(i)) # img = cv2.imread(img) # print("{}类别的预测结果为：{}".format(i, result.predict(img))) img = cv2.imread(os.path.join(os.getcwd(),"miccai/4.png")) explainer = lime_image.LimeImageExplainer() # 将input_image转换为RGB格式 input_image_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) input_image_rgb = np.array(input_image_rgb) predict_fn = lambda x: result.predict(x) print(result.predict(input_image_rgb)) explanation = explainer.explain_instance(input_image_rgb, predict_fn, labels=[4]) temp, mask = explanation.get_image_and_mask(explanation.top_labels[0], positive_only=True, hide_rest=True) cv2.imwrite('lime_output.png', temp) 代码如上result.predict(input_image_rgb)返回的结果就是这张图对应每个分类的得分，一个一维数组
Lime 代码
广东中学生: 你好，我的预测函数返回的是该图每个分类的得分，也就是一个一维数组，其他地方都和你一样，但是为什么我运行代码之后会提示报错，希望您看到后能帮忙回复一下，因为我已经找了一天的解决方案了： Traceback (most recent call last): File "python-process/miccai/model.py", line 187, in <module> explanation = explainer.explain_instance(input_image_rgb, predict_fn, top_labels=5) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_image.py", line 219, in explain_instance feature_selection=self.feature_selection) File "anaconda3/envs/pytorch/lib/python3.7/site-packages/lime/lime_base.py", line 182, in explain_instance_with_data labels_column = neighborhood_labels[:, label] IndexError: too many indices for array: array is 1-dimensional, but 2 were indexed
高动态范围红外图像压缩
ljl834830593: 你好，请教一下GF&DDE，834830593@qq.com
《Contrast Limited Adaptive Histogram Equalization》
2301_76479695: 博主，请问可以发一下原文嘛？我的邮箱是1913634071@qq.com

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。