深度学习之 3 线性模型

最新推荐文章于 2024-07-20 00:22:05 发布

水w

最新推荐文章于 2024-07-20 00:22:05 发布

阅读量1.1k

点赞数

文章标签：深度学习机器学习人工智能 python

本文链接：https://blog.csdn.net/qq_45956730/article/details/125688529

版权

本文是接着上一篇https://blog.csdn.net/qq_45956730/article/details/125688437?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22125688437%22%2C%22source%22%3A%22qq_45956730%22%7D&ctrtid=3xNGY

线性模型

1、Logistic回归

（1）模型介绍：将分类决策问题看作条件概率估计问题

（1）模型介绍：Softmax回归中，首先还是利用线性函数作特征的映射（判别函数）

线性模型

线性模型（Linear Model）是机器学习中应用最广泛的模型，指通过样本特征的线性组合来进行预测的模型。

给定一个 𝐷 维样本 𝒙 = 𝑥 1 , ⋯ , 𝑥 𝐷 T其线性组合函数为

线性回归是一种典型的线性模型：输出的标签是连续值------回归问题

分类问题：输出目标 𝑦 是一些离散的标签。

而特征的线性组合本身是连续值，即f(x;w)的值域为实数。需要引入一个非线性的决策函数 g(.)，使输出符合预期离散值的目标。

二分类问题：

例如，在二分类问题中，决策函数 g(⋅) 可以是符号函数

1、Logistic回归

可以看作预测值为“标签的对数几率”的线性回归模型。因此， Logistic 回归也称为对数几率回归。

（1）模型介绍：将分类决策问题看作条件概率估计问题

先用线性函数组合特征：，
引入非线性函数𝑔(.)来计算类别标签的条件概率 𝑝 (𝑦 = 𝑐 | 𝒙) ,其中𝑐 ∈ {0,1}。函数g(.) 把线性函数的值域从实数区间“挤压”到了(0,1)之间，可以用来表示概率。
那么如何构建函数g(.) ？采用Logistic函数

然后利用𝑔(.)= σ(𝒙) 作非线性决策，

（2）学习准则：

模型预测条件概率：

真实条件概率：对于一个样本 𝒙, 𝑦∗ ，属于不同类别的概率分别为

那么我们应该如何定义损失函数，衡量两个条件概率𝑝𝑤(𝑦|𝒙) 和𝑝𝑟(𝑦|𝒙)之间的差异？

补充：

熵：在信息论中，熵用来衡量一个随机事件的不确定性。

熵越高，则随机变量的信息越多；熵越低，则随机变量的信息越少。

在对分布 𝑝(𝑥) 的信息进行编码时，熵 𝐻(𝑝) 也是理论上最优的平均编码长度，这种编码方式称为熵编码。

交叉熵:是按照概率分布 𝑞 的最优编码方式对真实分布为 𝑝 的信息进行编码的长度。

在给定 𝑝 的情况下，如果 𝒒 和 𝒑 越接近，交叉熵越小 。如果 𝑞 和 𝑝 差别越大，交叉熵就越大。