Task1：机器学习算法（一）: 基于逻辑回归的分类预测

最新推荐文章于 2024-07-24 18:14:54 发布

狐狸取经

最新推荐文章于 2024-07-24 18:14:54 发布

阅读量117

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/lxg101015/article/details/117935390

版权

机器学习训练营LR学习笔记

学习知识点概要
学习内容
学习问题与解答
学习思考与总结

学习知识点概要

LogisticRegression在简单数据集上的分类
LR在鸢尾花(iris)数据集上的分类
- 从sklearn中导入iris数据集
pandas库(数据分析和处理工具)的使用
函数的使用方法

学习内容

本节利用 LR model做分类任务，在二分类和多分类任务上均可使用LR model。分类的结果通过sigmoid函数映射为[0,1]的数，很好的反映出预测结果的不同概率，取概率高的Label即为正确预测结果，使用的命令为clf.predict_proba()返回的是对应每个Label的概率。也可使用命令clf.predict直接预测样本的分类结果，而不是返回每个Label的概率取值。
使用命令plt.contour(x,y,z)画出决策边界（等高线：三维图像在二维空间的投影）

学习问题与解答

LR model 的 loss function
LR 采用的是交叉熵损失函数(学习准则)，并使用梯度下降法(优化算法)来对参数进行优化。其风险函数为
$\begin{aligned} \mathscr R (w)&=-\frac{1}{N}\sum_{n=1}^{N}\left(p_{r}(y^{(n)}=1|x^{(n)})\log \hat y^{(n)}+p_{r}(y^{(n)}=0|x^{(n)})\log(1- \hat y^{(n)})\right)\\ &=-\frac{1}{N}\sum_{n=1}^{N}\left(y^{(n)}\log \hat y^{(n)}+(1-y^{(n)})\log(1- \hat y^{(n)})\right) \end{aligned}$
风险函数 $\mathscr R(w)$ 关于 $w$ 的偏导数为
$\frac{\partial{\mathscr R(w)}}{\partial{w}}=-\frac{1}{N}\sum_{n=1}^{N}x^{(n)}(y^{(n)}-\hat y^{(n)})$
通过下式来迭代更新参数
$w_{t+1}\leftarrow w_{t}-\alpha\frac{\partial{\mathscr R(w)}}{\partial{w}}$