机器学习（四）——Logistic回归

最新推荐文章于 2022-09-27 15:34:01 发布

SampsonTse

最新推荐文章于 2022-09-27 15:34:01 发布

阅读量251

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SampsonTse/article/details/103804304

版权

目录

一、前言：

二、假设陈述

三、决策界限

四、获取参数

五、多元分类

一、前言：

吴恩达第七章Logistic回归（本文例子均来自吴恩达视频课）
本文公式中的θ与x均为向量而不是单个值

二、假设陈述

案例概述：根据肿瘤的大小判断是否为良性肿瘤。这是一个二项分布的问题，输出的结果分别用1和0来表示

在Logistic回归中，希望输出得是[0,1]这个范围，即为某种情况得概率（如下面这个公式就是y=1的概率）

g(z)为sigmoid函数

$\large h_\Theta (x)=g(\Theta ^{T}x)=p(y=1|x;\Theta )$

$\large g(z)=\frac{1}{1+e^{-z}}$

当得到的h_θ(x)>=0.5时，y=1

当得到的h_θ(x) < 0.5时，y=0

三、决策界限

假设有以下一个数据集，拟合函数为 $\large h_\Theta =g(\Theta _0+\Theta _1x_1+\Theta _2x_2)$ ，通过计算我们得到理想的参数为[-3,1,1]。

根据上一段sigmoid函数的图像可以看出

$\large z\geq 0$ 即 $\large -3+x_1+x_2\geq 0$ 时， $\large g(z)\geq 0.5$

通过简单的移向得到 $\large x_1+x_2\geq 3$ ，可以在坐标系中画出以下一条直线，这条直线就称之为决策边界。

这样我们就把数据集划分为两个部分，决策边界的下面为良性肿瘤，而决策边界上面为非良性肿瘤。

对于不同的数据集分布，可以采取不同的公式进行划分。

如下图便采用圆形图像进行划分。

四、获取参数

1.CostFunction

在回归问题中，采用的代价函数如下：

$\large J(\Theta )=\frac{1}{m}\sum_{i=1}^m Cost(h_\Theta (x),y)$

$\large Cost(h_\Theta (x),y)=\frac{1}{2}(h_\Theta (x^{i})-y^{i})^{2}$

但是在Logistic回归问题中不能采取相同的代价函数，因为我们采用的sigmoid函数，这使得代价函数的公式为一个非凹函数，该函数有多个较小值量，很难得到最小值。

因此在此采取新的代价函数

但是由于这是个分段函数，在计算过程中太麻烦，可以将此函数进行如下优化

$\large J(\Theta )=\frac{1}{m}\sum_{i=1}^m Cost(h_\Theta (x),y)$

$\large Cost(h_\Theta (x),y)=-y\log (h_\Theta (x))-(1-y)\log (1-h_\Theta (x))$

2.梯度下降

在此梯度下降的方法与前面的线性回归的梯度下降的方式是一样的。在此直接给出公式

repeat until convergence{

$\Theta_j :=\Theta _j-\alpha \frac{\partial J(\Theta))}{\partial \Theta_j }$

(simultaneously update all $\small \Theta _j$ )

}

五、多元分类

前面讨论的都是两种结果的情况，只需要分出两种类别。但是现实生活中我们需要分的情况远远不止两种情况。这个时候我们只需要把一个类别单独划分出来，剩下的几种情况归为统称为另一个类别，这样就转化为一个二元分类。这样用多个函数来把给种类别划分出来

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

SampsonTse CSDN认证博客专家 CSDN认证企业博客

码龄7年

47: 原创

7万+: 周排名

228万+: 总排名

4万+: 访问

: 等级

848: 积分

64: 粉丝

56: 获赞

38: 评论

223: 收藏

私信

关注

热门文章

最新评论

华南师大计算机学院软件工程专硕机试（2019考研）
灯笼只能来教室体验生活: 甲乙丙对一次竞赛名次进行预测。我的思路是枚举全排列，然后检查是否有某个排列满足甲乙丙各对一半。 [code=cpp] #include <iostream> #include <vector> using namespace std; const int n = 4; vector<vector<int>> res; vector<int> tmp; vector<bool> st(n + 1, false); // 全排列 void dfs(int u) { if(u > n) { res.push_back(tmp); return; } for(int i=1; i<=n; ++i) { if(!st[i]) { st[i] = true; tmp.push_back(i); dfs(u+1); st[i] = false; tmp.pop_back(); } } } bool check_rank() { for(vector<int>& seq : res) { // a,b,c 分别表示甲乙丙正确的预测数量 int a = 0, b = 0, c = 0; if(seq[0] == 1) ++a; if(seq[1] == 3) ++a; if(seq[2] == 1) ++b; if(seq[3] == 4) ++b; if(seq[3] == 1) ++c; if(seq[1] == 3) ++c; // 甲乙丙说对了一半，并且每个人只预测了2次，因此 a == b == c == 1 if(a == 1 && b == 1 && c == 1) { for(int x : seq) cout << x << ' '; cout << endl; } } } int main() { dfs(1); check_rank(); return 0; } [/code]
C++ 动态定义二维数组
请系好鹌鹑蛋: 怎么释放指针捏
C++ 动态定义二维数组
qq_63719770: 原来可以这样
华南师大计算机学院软件工程专硕机试（2019考研）
又双叒叕彳亍了?: 一般复试几道这种题。这一道题敲也挺耗时间的。
华南师大计算机学院软件工程专硕机试（2018考研）
wusonghuazzx: 华师的机试是oj还是人工批改呀？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。