【Machine Learning】对数几率(logistic)回归

最新推荐文章于 2023-07-28 10:27:02 发布

Lawe

最新推荐文章于 2023-07-28 10:27:02 发布

阅读量4.3k

点赞数

分类专栏： Machine Learning 文章标签：机器学习 Logistic回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/law_130625/article/details/52713853

版权

本文记录了作者使用机器学习实战中的随机梯度上升法进行对数几率回归训练的过程。实验涉及57维样本，通过Sigmoid函数将预测值转化为0/1分类，并以10000个样本的1000个子集进行训练，剩余样本用于测试。文中详细阐述了随机梯度上升算法的伪代码，并展示了如何计算和更新回归系数。最后，使用训练得到的分类器评估剩余样本的判别错误率。

摘要由CSDN通过智能技术生成

这几天做了一个小作业，采用对数回归的方法进给定数集进行训练后再测试，我用的是机器学习实战中介绍的随机梯度上升的办法训练，由于接触机器学习和Python不久，这个主要是为了记录自己的学习之路，希望慢慢的从中得到进步。

一、实验原理

对于二分类任务，其输出标记0和1，但是线性回归模型中产生的预测z，因而需要将实值z转换为0/1值。在数学上正好有这样一个替代函数（Sigmoid函数）：其在z等于0附近变得很陡，两侧则接近于0或1值。

为了实现对数几率回归分类器，我们将每个特征值与回归系数相乘后得到的结果值相加得到z，将这个总和代入Sigmoid函数中，进而就可以得到了一个范围在0与1之间的数值。并且任何大于0.5的数据归入1类，小于0.5的归入0类。即得到。因而本次实验的重点内容在于如何训练回归系数w上。实验给出了10000个57维样本，根据以上对数几率回归原理求出判别函数，然后根据判别函数既能对未知样本进行判别。

二、Logistic回归算法

针对于本次实验给的两类57维的样本各5000个，采取从中各随机抽取1000个样本组成2000个训练样本来进行对数几率回归训练剩余8000个样本对训练得到的分类器进行测试。

其中在数据的处理上，为了方便计算和分析，把第57列的标签值为2的改为0。由于在数据上没有缺失值等问题，所以不再做其他处理。

本次实验在训练回归系数的过程中，主要采取了随机梯

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。