逻辑斯蒂回归-机器学习ML

最新推荐文章于 2023-02-17 17:57:33 发布

HelloZEX

最新推荐文章于 2023-02-17 17:57:33 发布

阅读量449

点赞数 1

分类专栏：机器学习文章标签：统计学机器学习李航算法逻辑斯蒂回归

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

参考：

1.《统计学习方法》李航

2.http://blog.csdn.net/shijing_0214/article/details/51089330#insertcode

逻辑斯蒂回归是一个非常经典的二项分类模型，也可以扩展为多项分类模型。其在应用于分类时的过程一般如下，对于给定的数据集，首先根据训练样本点学习到参数w,b;再对预测点分别计算两类的条件概率，将预测点判为概率值较大的一类。

1、线性模型
逻辑斯蒂回归属于对数线性模型，那什么是对数线性模型？首先我们介绍下线性模型。
给定包含d个属性的变量x=( x1,x2,...,xd ), xi 表示在第i个属性上的取值，线性模型通过学得一个对属性分量的线性组合来进行预测的函数，即：

f(x)=w1x1+w2x2+⋯+wdxd+b

写成向量形式为：

f(x)=wTx+b

线性模型形式简单，易于建模，很多不错的非线性模型都是以线性模型为基础，通过层次组合或高维映射形成。此外，向量w作为各分量的权值，可以很直观地解释各属性在模型分类中的重要性，例如：

f好瓜=0.2⋅x色泽+0.5⋅x根蒂+0.3⋅x敲声 +1

显然，根蒂对判断是否为好瓜的影响最大。
当我们给定样例点 (x,y) ，若线性模型对给定样本点的预测值 f(x) 逼近真实值y时，就形成了线性回归模型，记为：

y=wTx+b

线性回归模型表征了输入x与输出y的一种线性关系，我们还可以定义输入x与输出y的函数g(y)的一种线性关系，如：

lny=wTx+b

就是一种对数线性回归，使x与输出的对数形成线性关系，实际上使用w^Tx+b的指数 ewTx+b 来逼近输出。
考虑一般性，我们记：

g(y)=wTx+b

其中，g(y)应满足单调可微的性质。我们将这样的模型称为“广义线性模型”，对数线性模型即g函数取对数函数的情况。
2、逻辑斯蒂回归模型
开始提到了逻辑斯蒂回归是一种对数线性模型，也就是说其输入与输出的对数函数成线性关系，实际上，它们满足如下关系：

logP(Y=1|x)P(Y=0|x)=wTx+b

关系如何得来的?
根据上面提到的广义线性模型，对预测值的对数函数，需要满足单调可微的性质，且方便进行二项分类，于是选取了S形曲线Sigmoid函数作为 g−(⋅) 函数，如下：

y=11+e−z

图形如下：

我们将输入的线性组合代替Sigmoid函数中的输入，得到逻辑斯蒂回归模型。
逻辑斯蒂回归模型是如下的条件概率分布：

P(Y=1|x)=11+e−(w⋅x+b)=e(w⋅x+b)1+e(w⋅x+b)

P(Y=0|x)=1−P(Y=1|X)=11+e(w⋅x+b)

显然，条件概率分布与曲线是一致的，即当输入越小时，取正例的概率趋近于0，取反例的概率趋近于1；当输入越大时，取正例的概率则趋近于1，取反例的概率趋近于0.
记：

y=P(Y=1|x)

1−y=P(Y=0|x)

则有：

y1−y=P(Y=1|x)P(Y=0|x)=ew⋅x+b

即：

logy1−y=w⋅x+b

从而得出关系。这里我们把 logy1−y=w⋅x+b 称作对数几率，表示一个事件预测为正例与反例的比值的对数。

3、模型参数估计
我们得到逻辑斯蒂回归模型的表示，也即条件概率分布后，需要得到参数w,b的值才能对未知输入点进行预测。
对于逻辑斯蒂回归模型，一般使用极大似然估计的方法估计模型参数。转化为对数似然函数后，问题就变成了带有参数的求似然函数值最大值的最有问题。因为这是属于无约束优化问题，一般采用梯度下降法、牛顿法、拟牛顿法等方法来进行求解，得到参数估计值 w^,b^ 后，代入条件概率分布公式：

P(Y=1|X)=e(w^⋅x+b^)1+e(w^⋅x+b^)

P(Y=0|X)=11+e(w^⋅x+b^)

即可实现对二项分类的预测。

4、多项逻辑斯蒂回归
二项逻辑斯蒂回归也可以推广到多项逻辑斯蒂回归，从而应用到多类分类问题中。
假设类别集合为{1,2,…,K}，多项逻辑斯蒂回归模型可以写作：

P(Y=k)=exp(wk⋅x)1+∑K−1k=1exp(wk⋅x)

P(Y=K|x)=11+∑K−1k=1exp(wk⋅x)

可以满足

∑Kk=1P(Y=k|x)=1

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逻辑斯蒂回归-机器学习ML

参考：1.《统计学习方法》李航2.http://blog.csdn.net/shijing_0214/article/details/51089330#insertcode逻辑斯蒂回归是一个非常经典的二项分类模型，也可以扩展为多项分类模型。其在应用于分类时的过程一般如下，对于给定的数据集，首先根据训练样本点学习到参数w,b;再对预测点分别计算两类的条件概率，将预
复制链接

扫一扫

专栏目录

HelloZEX CSDN认证博客专家 CSDN认证企业博客

码龄8年

华为科技有限公司

264: 原创

3万+: 周排名

67万+: 总排名

136万+: 访问

: 等级

1万+: 积分

478: 粉丝

668: 获赞

133: 评论

2821: 收藏

私信

关注

热门文章

分类专栏

最新评论

【C++笔记】如何判断2个线段相交
xybf: wok就是这，我调了两个小时[裂开]
【C++笔记】原码、反码、补码
做而论道_CS: 用 C 编程，如：　i = －125;　。这语句中的负数：－125;，是五个 ASCII 码：“－、1、2、5、；”。把 ASCII 码形式的负数 “－125”，　变成补码 1000 0011，　　是怎么变换的？可以肯定的说：根本就不是取反加一！原码反码取反加一。。。　可说是：一无是处。
【C++笔记】原码、反码、补码
做而论道_CS: 在 C 和 C++ 中编程，只需用到【正负十进制数】。该数值，存入内存，必定是【补码】。因此，学习 C 语言，只会遇上【数值和补码】。绝对不会碰上：原码和反码。那么，讨论原码和反码，是不是无事生非呢？
【C++笔记】原码、反码、补码
做而论道_CS: 同理，求正数的补码，公式则为：　正数的补码 = 256 + 该正数。要知道，加上 256，就是出现一个进位。进位必须舍弃，所以，256 就不用加了。于是有：　正数的补码 = 该正数。在此处，这就证明了：　零和正数的补码，就该数字本身。举例，就不用了吧。计算机专家也是说：　正数的补码，就是其自身。但是，他们并没有给出任何证明。他们为什么不证明呢？因为，这些专家：　不懂什么是进位。　更不懂什么是舍弃进位。－－－－－－－－－－－－－－－－－－－－另外，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1= －31。再看，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了！－－－－－－－－－－－－－－－－－－－－－－那么，所谓的：　机器数真值符号位原码反补码正数三码与正数相同　负数取反加一符号位不变符号位也参加运算模同余 ... 这一大堆乱七八糟的概念，不都是垃圾嘛！进位，是小学二年级的知识点吧？　舍弃进位，很难理解吗？　老外竟然能弄出那么大一堆概念！　老外的数学水平，由此可见一斑。谁要是跟老外学算术，立刻、马上，就掉沟里去了！我们的计算机老师，也不懂数学，只知道跟风。　一天一天的，在大学里，兜着圈子讲小学的知识。　真是毁人不倦坑人不浅！这些老师，捡个鞋拔子就当成玉如意了。　天天蒙骗学生，赚取名声和丰厚的讲课费。　　顺便再抓几个学生挂科，抖一下威风！现在知道我们缺芯片用的原因了吧！
【C++笔记】原码、反码、补码
做而论道_CS: 所谓的：机器数符号位原码反码 ... 都是计算机专家在【忽悠、卖拐】而已。所谓的 “补码”，也是正常的数字。　也并非一定是二进制数。你看十进制吧，两位数：0 ~ 99。可以有：27 + 99 = (一百) 26 也可以：27 － 1 = 26 如果你忽略进位，依旧保持两位数，　这两种算法的功能，就是相同的！就是说，当你舍弃了进位：　负数，就能用正数代替；　加法，竟然就能实现减法运算！在计算机中，舍弃进位，会怎样？　就可以简化硬件。　用一个加法器，便可横行天下！由此可知，“补码”，根本就不是什么新鲜事。　“补码” 关键，是：【舍弃进位】。　并不是：符号位原码反码取反加一。－－－－－－－－－－－－－－－－－－－－用两位十进制运算时，舍弃进位，就是【减去一百】。那么，加 99，再减 100，当然就是 “－1” 了。计算机使用的，是二进制数。八位二进制数是：0000 0000 ~ 1111 1111。相当于十进制数：0 ~ 255。如果出现进位 = 1，就是：2^8 = 256。那么，加 255，再减 256，这也就是 “－1” 了。所以：+255 (1111 1111)，就是：－1；同理：+254 (1111 1110)，就是：－2；　　　+253 (1111 1101)，就是：－3；　　　。。。　。。。　　　+128 (1000 0000)，即：－128。以上这些正数，就是计算机专家 “发明” 的补码了。由此可知：　所谓的 “补码”，也是正常的数字。　它与 “符号位原码反码” 也没有任何关系。　之所以能代替负数，关键是【舍弃了进位】。至此，你肯定能看出关系式：　负数的补码 = 256 + 该负数。一般化，就是：　负数的补码 = 2^n + 该负数。　n，是二进制数的位数。例：求－31 的 “补码” 是多少？解：256－31 = 225 = 1110 0001 (二进制)。这不就求出来了吗！哪还用琢磨什么：符号位原码取反。。。！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。