线性回归与感知机

fireflywaterfall

已于 2024-04-01 13:10:33 修改

阅读量839

点赞数 34

分类专栏：神经网络从入门到入土文章标签： python 深度学习神经网络

于 2024-03-29 22:21:46 首次发布

本文链接：https://blog.csdn.net/qq_45986389/article/details/137156324

版权

神经网络从入门到入土专栏收录该内容

6 篇文章 0 订阅

订阅专栏

线性回归与感知机

线性回归与感知机

线性回归与感知机

线性回归

线性回归是利用数理统计中回归分析，确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。即利用一条曲线(直线)去尽量拟合数据，并使用拟合的曲线来预测任意变量对应的值。
线性回归示意图

线性回归要素

训练集：也称训练数据，即输入的数据，一般用 $x$ 表示
输出数据：一般用 $y$ 表示
模型：假设，即拟合的函数，一般用 $y = h (x)$ 表示
训练集的条目数：一条训练数据由一对输入数据和输出数据组成，输入数据的维度 $n$ 为特征的个数

线性回归问题求解

假设拟合函数和 $n + 1$ 个因素有关，令 $\theta = [\theta_0,\theta_1,...,\theta_n]$ ， $x=[1,x_1,x_2,...,x_n]$ ，则有： $h_\theta(x) = \theta^T x$
假设给定样本 $x^{(i)},y^{(i)})$ ，构造代价（误差、损失）函数，此损失函数为均方根形式：
$J(\theta) = \frac1 2\sum_i \left(y^{(i)}-h_\theta\left(x^{(i)}\right)\right)^2$
目标：找到超平面参数 $\theta$ 使 $J(\theta)$ 最小，即求解 $\min_\theta J(\theta)$
$\theta = \left(X^TX\right)^{-1}X^Ty$

线性二分类

线性分类器透过特征的线性组合分类，即通过直线（或超平面）分类
线性二分类示意图

线性二分类问题求解

构造二分类的“分界直线”，一边为负，一边为正，距离分界线越远，其归为对应类的概率越大。
对于概率的求解使用sigmoid函数：
$\frac{1}{1+\exp(-z)}\\[2mm] z = \theta_1x_1+ \theta_2x_2+ \theta_0$
sigmoid函数满足：
$y^{'} = y (1 - y)$
假设给定样本 $x^{(i)},y^{(i)})$ ，其中 $y^{(i)}$ 只能取0和1，构造代价（误差、损失）函数：
$J(\theta) = \frac1 2\sum_i \left(y^{(i)}-h_\theta\left(x^{(i)}\right)\right)^2$
其中：
$h_\theta\left(x^{(i)}\right) = \frac{1}{1+\exp(-\theta^Tx^{(i)})}$

目标：找到超平面参数 $\theta$ 使 $J(\theta)$ 最小，即求解 $\min_\theta J(\theta)$

此类回归问题称为softmax回归

对于这种非线性问题求解采用梯度下降法：
$J(\theta_{k+1}) = J(\theta_{k})+\left[\frac{dJ}{d\theta}\right]^T\Delta\theta_k\\[2mm] \Delta\theta_k = -\alpha\frac{dJ}{d\theta}$

对数回归

对于二分类问题从概率角度描述：
$P(y^{(i)}=1|x^{(i)}) = h_\theta(x^{(i)})\\[2mm] P(y^{(i)}=0|x^{(i)}) = 1-P(y=1|x^{(i)}) = 1-h_\theta(x^{(i)})$
修改损失函数为：
$J(\theta) = -\sum_i (y^{(i)})\log(h_\theta(x^{(i)}))+(1-y^{(i)})\log(1-h_\theta(x^{(i)}))$
对其最小化，有：
$\Delta_\theta J(\theta) = \sum_i x^{(i)}(h_\theta(x^{(i)})-y^{(i)})$

神经元模型与作用函数

神经元模型

生物神经元模型
人工神经元模型
单神经元模型

设 $\sum_jw_jx_j-\theta = w^Tx$ ，则有： $y = f (z)$ ，并且 $1,z\ge0;0,x<0$

作用函数

非对称型log sigmoid函数，用于分类问题求解：
$\frac{1}{1+\exp(-\beta x)}$
对称型tangent sigmoid函数，用于拟合问题求解：
$\frac{1-\exp(-\beta x)}{1+\exp(-\beta x)}$
对称型阶跃函数，具有阶跃作用，称为阈值逻辑单元：
$1,x\ge0;-1,x<0$

感知机模型

感知机（perceptron）是Rosenblatt于1957年提出的模型，是神经网络和支持向量机的基础
点到超平面的距离：
$\frac{w^Tx}{||w||}$
感知机从输入到输出的模型如下：
$sign(w^Tx)\\[2mm] sign(x) = -1,x<0;1,x\ge0$
对于样本 $x^{(i)},y^{(i)})$ ，如果样本正确分类，则有：
$\frac{y^{(i)}(w^Tx^{(i)})}{||w||}>0,正确分类\\[2mm] \frac{y^{(i)}(w^Tx^{(i)})}{||w||}<0,错误分类$
损失函数定义如下：
$-\frac{1}{||w||}\sum y^{(i)}(w^Tx^{(i)})$
找到超平面参数 $w^*$ 满足：
$L(w^*) = \min_w \sum y^{(i)}(w^Tx^{(i)})$

fireflywaterfall

关注

34
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
线性回归与感知机

线性回归是利用数理统计中回归分析，确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。即利用一条曲线(直线)去尽量拟合数据，并使用拟合的曲线来预测任意变量对应的值。构造二分类的“分界直线”，一边为负，一边为正，距离分界线越远，其归为对应类的概率越大。训练集的条目数：一条训练数据由一对输入数据和输出数据组成，输入数据的维度。线性分类器透过特征的线性组合分类，即通过直线（或超平面）分类。训练集：也称训练数据，即输入的数据，一般用。模型：假设，即拟合的函数，一般用。目标：找到超平面参数。
复制链接

扫一扫