机器学习入门系列三（关键词：逻辑回归，正则化）

最新推荐文章于 2023-12-15 10:08:36 发布

「已注销」

最新推荐文章于 2023-12-15 10:08:36 发布

阅读量2.4k

点赞数 1

分类专栏：机器学习文章标签：机器学习正则数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/walegahaha/article/details/50471417

版权

一、逻辑回归

1.逻辑回归

什么是逻辑回归问题，通俗地讲就是监督下的分类问题。通过前面的学习，我们已经掌握如何解决线性(非线性)回归的问题。那面对分类问题我们是否也可以用线性回归呢？简单起见，我们先讨论二元分类，首先让我们来看一个例子，肿瘤的大小与是否是恶性的关系，其中红色的 $\times$ 表示肿瘤大小，对应的 $y$ 轴表示是否为恶性。
这里写图片描述
我们对数据进行线性回归，得到了一条很完美的直线。我们可以规定，当拟合出来的 $y$ 值大于0.5时，为恶性1；当 $y$ 值小于0.5时，为良性0。这一切看起来似乎很合理，当我们增加一个数据，即有一个肿瘤非常大，显然它是恶性的，但是再用线性回归时，我们可以发现为了去更好地拟合，直线的斜率变低，0.5不再是恶性与良性的分界线。除了这个问题之外，我们知道 $y$ 的可取值应该是 $[0,1]$ ，而采用线性回归我们发现y的可取值是 $[-\infty,+\infty]$ 。这一系列的问题就促使我们希望寻求一个新的方法来解决分类问题。

2.假设表示

在线性回归问题中，我们定义了

h θ (x) = θ T x (1)

$h_\theta(x)=\theta^\mathrm{T}x \tag{1}$ 在分类问题中，我们改变该函数，增加一个作用函数，即

h θ (x) = g (θ T x) (2)

$h_\theta(x)=g(\theta^\mathrm{T}x) \tag{2}$ 其中

g(z) $g(z)$ 为sigmoid函数

g (z) = 1 1 + e - z (3)

$g(z)=\frac{1}{1+e^{-z}}\tag{3}$
那么把式(3)代入式(2)，得

h θ (x) = 1 1 + e - θ T x (4)

$h_\theta(x)=\frac{1}{1+e^{-\theta^\mathrm{T}x }}\tag{4}$ 为什么要使用sigmoid函数？有一系列的数学原因，感兴趣的可以搜索广义线性模型，在这里就不阐述原因了。我们来直观地感受一下sigmoid函数，当

z→−∞ $z\rightarrow-\infty$ 时，

g→0 $g\rightarrow0$ ；当

z→+∞ $z\rightarrow+\infty$ 时，

g→1 $g\rightarrow1$ 。
这里写图片描述

这里写图片描述

下面我们对

hθ(x) $h_\theta(x)$ 输出的结果做一个解释。由于它的取值范围，我们可以把它理解为概率。若

hθ(x)=0.7 $h_\theta(x)=0.7$ ，在二元分类（本例）中即表示肿瘤在输入变量

x $x$ 下为恶性(

y=1 $y=1$ )的概率为

70% $70\%$ 。由于是二元分类，

y $y$ 取值不是0就是1，因此肿瘤为良性(

y=0 $y=0$ )的概率为

1−70%=30% $1-70\%=30\%$ 。
由于sigmoid函数的性质，且

hθ(x)∈(0,1) $h_\theta(x)\in(0,1)$ ，我们认为当

hθ(x)≥0.5 $h_\theta(x)\ge0.5$ 时，我们把数据

x $x$ 预测为类1即

y=1 $y=1$ ；当

hθ(x)<0.5 $h_\theta(x)\lt0.5$ 时，我们把数据

x $x$ 预测为类0即

y=0 $y=0$ 。因此当

θTx≥0 $\theta^\mathrm{T}x\ge0$ 时，预测为类1;当

θTx<0 $\theta^\mathrm{T}x\lt0$ 时，预测为类0。

3.决策边界

既然是分类问题，那么对于二分类，

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄9年

12: 原创

-: 周排名

-: 总排名

16万+: 访问

: 等级

1240: 积分

92: 粉丝

90: 获赞

46: 评论

439: 收藏

私信

关注

热门文章

分类专栏

最新评论

卷积神经网络(CNN)讲解及代码
佩奇身上纹: 如何进行测试啊，写不来测试代码
卷积神经网络(CNN)讲解及代码
qq_53576402: 请问train_x和train_y报错“函数或变量名无法识别”要怎么解决呀
卷积神经网络(CNN)讲解及代码
cjjszl: 未定义函数或变量 'isOctave'。出错 cnnsetup (line 2) assert(~isOctave() || compare_versions(OCTAVE_VERSION, '3.8.0', '>='), ['Octave 3.8.0 or greater is required for CNNs as there is a bug in convolution in previous versions. See http://savannah.gnu.org/bugs/?39314. Your version is ' myOctaveVersion]); 您好，这个问题怎么解决，可以告诉我吗？
卷积神经网络(CNN)讲解及代码
cjjszl: 未定义函数或变量 'isOctave'。出错 cnnsetup (line 2) assert(~isOctave() || compare_versions(OCTAVE_VERSION, '3.8.0', '>='), ['Octave 3.8.0 or greater is required for CNNs as there is a bug in convolution in previous versions. See http://savannah.gnu.org/bugs/?39314. Your version is ' myOctaveVersion]); 您好，这个问题怎么解决，可以告诉我吗？
树莓派3B使用教程
Tisfy: 我曾经流连于宋元的词曲，但刚发现此文甚妙！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。