回归(regression)和logistic regression

最新推荐文章于 2023-08-02 14:00:11 发布

Elijha

最新推荐文章于 2023-08-02 14:00:11 发布

阅读量727

点赞数

分类专栏： ML & DL 文章标签： logistic regression 回归

本文链接：https://blog.csdn.net/u011636567/article/details/71170692

版权

ML & DL 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

回归

“回归”就是“回归本质”的意思。用一个函数去拟合一组数据 $(x^i,y^i)$ ，随着数据越来越多，用来拟合的这个曲线就越来越接近真实的情况。这里 $x^i$ 可以是一个向量, 假设 $x^i \in R^n$ , 若用线性回归的方法, 首先把它扩展为 $n+1$ 维, 用来拟合的参数 $\theta \in R^{n+1}$ ; 其中 $x_0 =1$ , 对应 $\theta_0$ 为截距. , 所以函数拟合的是一个 $n+2$ 维的超平面( $\theta^T \cdot x-y=0$ ). 拟合后得到的超平面, 输出前 $n+1$ 维的输入, 可以得到一个输出 $y$ .
* linear regression：用直线拟合
* logistci regression：用一种曲线拟合（曲线的形状和sigmoid有什么联系?）

Logistics regression

$\theta^T \cdot x$ 是linear regression，套一层sigmoid将输出映射到 $(0,1)$ 。

假设训练集为 ${(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})}$ ；输入特征为 $x^{(i)} \in R^{n+1}$ （我们对符号的约定如下：特征向量 $x^{(i)}$ 的维度为 $n+1$ ，其中 $x_0=1$ ，对应截距项）。由于logistic回归是针对二分类问题的，因此类标记 $y^{(i)} \in \{0,1\}$ 。假设函数(hypothesis function) 如下：

h θ (x) = 1 1 + e - θ T \cdot x, θ \in R n + 1

$h_\theta(x)=\frac{1}{1+e^{-\theta^{T} \cdot x}}, \theta \in R^{n+1}$
Interpretion：

hθ(x(i))=Sigmoid(θT⋅x(i)) $h_\theta (x^{(i)}) = Sigmoid(\theta^T \cdot x^{(i)})$ 是

y(i)=1 $y^{(i)}=1$ 的概率，

1−hθ(x(i)) $1-h_\theta (x^{(i)})$ 是

y(i)=0 $y^{(i)}=0$ 的概率( 吴恩达，Logistic Regression: Optimization Objective I)

训练 $\theta$ ，使其能最小化代价函数：

J (θ) = - 1 m [\sum i = 1 m log h θ (x (i)) + (1 - y (i)) log (1 - h θ (x (i)))]

$J(\theta)=-\frac{1}{m}[\sum_{i=1}^{m}\log h_\theta(x^{(i)})+(1-y^{(i)})\log(1-h_\theta(x^{(i)}))]$
为什么cost function定义为这样？
* 首先的确可以定义为squared error的形式，即