2020.10.25

最新推荐文章于 2024-07-12 16:21:48 发布

weixin_47366250

最新推荐文章于 2024-07-12 16:21:48 发布

阅读量143

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_47366250/article/details/109280978

版权

机器学习

图中的叉号就是我们的数据样本，横轴为肿瘤大小，纵轴为是否为恶性肿瘤。如果用我们之前学习的线性回归方程，则可以假设 $h_\theta(x) = \theta^Tx$ 。可以得出图中的倾斜的斜率高一点的那一条直线。为了更好的做出预测，我们可以设定当 $h_\theta(x)>=0.5$ 时，认为 $y = 1$ ,当 $h_\theta(x)<0.5$ 时，认为 $y = 0$ ,如此看来，假设我们在x轴正方向远处还有一点如图中所示，我们的假设函数也是满足实际情况。但如果我们的假设函数设置的如图中斜率偏低的那一条呢。很显然和数据集中的数据发生了误差。所以线性回归在分类问题中并不是最适合的方法，而且如果使用线性回归，我们得出的 $h_\theta(x)$ 是可以大于1或者小于0。而接下来要讨论的logistic分类算法的值域大小是在[0,1]之间的。

假设函数
在线性回归中，我们的假设函数公式是 $h_\theta(x) = \theta^Tx$ ，那么在分类问题中，我们定义 $h_\theta(x) = g(\theta^Tx)$ ,这里的函数g的定义为 $g(z)=\frac{1}{1-e^{-z}}$ , $z=\theta^Tx$ ,则

hθ(x)=11−e−θTx
这个函数被称作S型函数（Sigmoid function）或逻辑函数（Logistic function）。函数的图像如下图所示：

横轴为z，纵轴为 $g (z)$ 。显然当z趋向于正无穷时， $g (z)$ 趋向于1，z趋向于负无穷时， $g (z)$ 趋向于0。图像在（0，0.5）点于纵轴相交。我们现在要做的依然是选择合适的参数 $\theta$ 来拟合数据。
这里我们将 $h_\theta(x)$ 的输出假设为当输入为x时，y=1时的概率。从概率上的角度来描述可以表达为 $h_\theta(x) = P(y=1|x;\theta)$ 。因此我们可以得到如下公式：

P(y=1|x;θ)+P(y=0|x;θ)=1P(y=1|x;θ)=1−P(y=0|x;θ)
决策边界(decision boundary)
上述我们说过，可以假设当 $h_\theta(x)>=0.5$ 时，认为 $y = 1$ ,当 $h_\theta(x)<0.5$ 时，认为 $y = 0$ 。根据逻辑函数的图像，我们得知，当z>0时， $h_\theta(x)>=0.5$ ，则 $\theta^Tx>=0$ ,同样的 $h_\theta(x)<0.5$ 时 $\theta^Tx<0$ 。
这里可以举一个例子，假设 $h_\theta(x) = g(\theta_0+\theta_1x_1+\theta_2x_2)$ 中的 $\theta_0,\theta_1，\theta_2$ 分别等于-3，1,1。则$\theta =
⎡⎣⎢−311⎤⎦⎥
$, 那么 y = 1 时，即代表$ h_\theta(x) = g(\theta_0+\theta_1x_1+\theta_2x_2) >= 0.5 $, 即$ \theta^Tx = -3+x_1+x_2>=0 $, 相反 y = 0 时，$ \theta^Tx = -3+x_1+x_2<0 $, 那么我们可以得出这两个不等式的分界线即$ x_1+x_2=3$。

在这条直线的上方代表y=1的部分，下方则代表y=0的部分，而这条直线就被称作决策边界。
下面再继续看一个复杂点的例子，这里额外添加两个特征 $x_1^2，x_2^2$ 。 $h_\theta(x) = g(\theta_0+\theta_1x_1+\theta_2x_2\theta_3x_1^2+\theta_4x_2^2)$ 。假定$\theta =
⎡⎣⎢⎢⎢⎢⎢⎢−10011⎤⎦⎥⎥⎥⎥⎥⎥
$, 则可得出若$ -1+x_1^2+x_22>=0 $, 则 y = 1, 若$ -1+x_1^2+x_22<0 $, 则 y = 0, 那么显然，这里的决策边界的图像是$ x_1^2+x_22 = 1$。

当然随着假设函数的复杂程度变化，决策边界也会各有不同。后面我们将会学习如何自动选择参数 $\theta$ ,使我们能在给定一个训练集时，根据数据自动拟合参数在这里插入图片描述
如果我们有 100 行数据，我们从 1 行数据开始，逐渐学习更多行的数据。思想是：
当训练较少行数据的时候，训练的模型将能够非常完美地适应较少的训练数据，但是训练出
来的模型却不能很好地适应交叉验证集数据或测试集数据。在这里插入图片描述

如何利用学习曲线识别高偏差/欠拟合：作为例子，我们尝试用一条直线来适应下面的
数据，可以看出，无论训练集有多么大误差都不会有太大改观：在这里插入图片描述
也就是说在高偏差/欠拟合的情况下，增加数据到训练集不一定能有帮助。

weixin_47366250

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020.10.25

机器学习图中的叉号就是我们的数据样本，横轴为肿瘤大小，纵轴为是否为恶性肿瘤。如果用我们之前学习的线性回归方程，则可以假设hθ(x)=θTxh_\theta(x) = \theta^Txhθ(x)=θTx。可以得出图中的倾斜的斜率高一点的那一条直线。为了更好的做出预测，我们可以设定当hθ(x)>=0.5h_\theta(x)>=0.5hθ(x)>=0.5时，认为y=1y=1y=1,当hθ(x)<0.5h_\theta(x)<0.5hθ(x)<0.5时，认为y=0y=
复制链接

扫一扫