python鸢尾花数据集_Python实现鸢尾花数据集分类问题——使用LogisticRegression分类器...

最新推荐文章于 2021-03-26 19:20:28 发布

贝拉大帝

最新推荐文章于 2021-03-26 19:20:28 发布

阅读量1.5k

点赞数

文章标签： python鸢尾花数据集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34377697/article/details/114467673

版权

本文介绍了使用LogisticRegression分类器解决鸢尾花数据集的分类问题。通过逻辑回归模型的原理、代码实现和实验结果分析，展示了如何处理多分类任务，并对比了使用不同特征数量的误判情况，强调了特征选择对模型性能的影响。

摘要由CSDN通过智能技术生成

. 逻辑回归

逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题，常见的是二分类或二项分布问题，也可以处理多分类问题，它实际上是属于一种分类方法。

概率p与因变量往往是非线性的，为了解决该类问题，我们引入了logit变换，使得logit(p)与自变量之间存在线性相关的关系，逻辑回归模型定义如下：

1 #Sigmoid曲线:

2 importmatplotlib.pyplot as plt3 importnumpy as np4

5 defSigmoid(x):6 return 1.0 / (1.0 + np.exp(-x))7

8 x= np.arange(-10, 10, 0.1)9 h = Sigmoid(x) #Sigmoid函数

10 plt.plot(x, h)11 plt.axvline(0.0, color='k') #坐标轴上加一条竖直的线(0位置)

12 plt.axhspan(0.0, 1.0, facecolor='1.0', alpha=1.0, ls='dotted')13 plt.axhline(y=0.5, ls='dotted', color='k') #在y=0.5的地方加上黑色虚线

14 plt.yticks([0.0, 0.5, 1.0]) #y轴标度

15 plt.ylim(-0.1, 1.1) #y轴范围

16 plt.show()

二、鸢尾花分类问题的思路分析

(1)选择使用LogisticRegression分类器，由于Iris数据集涉及到3个目标分类问题，而逻辑回归模型是二分类模型，用于二分类问题。因此，可以将其推广为多项逻辑回归模型(multi-nominal logistic regression model)，用于多分类。

(2)根据多项逻辑回归模型，编写代码，输入数据集，训练得到相应参数并作出预测。

(3)对预测出的数据的分类结果和原始数据进行可视化展示。

三、多项逻辑回归模型的原理及推导过程

假设类别Y 的取值集合为 {1,2，...，K}，那么多项逻辑回归模型是：

其似然函数为：

其中，

为模型在输入样本

时，将其判为类别k 的概率；

起到指示函数的作用，当K 等于样本

的标签类别时为1，其余均为0。

对似然函数取对数，然后取负，得到

(简记为：

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。