sklearn官方文档1.5.7

最新推荐文章于 2023-03-06 16:20:05 发布

MiaL

最新推荐文章于 2023-03-06 16:20:05 发布

阅读量489

点赞数 1

分类专栏：机器学习

机器学习专栏收录该内容

28 篇文章 2 订阅

订阅专栏

scikit-learn 官方文档翻译学习

1.5.7 数学公式
来源：https://scikit-learn.org/stable/modules/sgd.html#mathematical-formulation

给定一组训练实例 $(x_1,y_1),\cdot\cdot\cdot,(x_n,y_n),$ 其中 $x_i \in R^m$ ，和 $y_i \in \{-1,1\}$ ,需要学习目标函数 $f(x)=w^Tx+b$ 。通过最小化训练误差来学得最佳参数 $w, b$ : $E(w,b)=\frac{1}{n}\sum_{i=1}^{n}L(y_i,f(x_i))+\alpha R(w)$ 其中 $L$ 是经验损失函数， $R$ 是正则化项（惩罚项）。
通常 $L$ 可选的形式包括：

合页函数（Hinge）：支持向量机（软间隔）
对数函数（log）：逻辑回归
最小平方差（Least-Suqares）：岭回归
Epsilon敏感：（软间隔）支持向量回归
以上所有这些损失函数都可以看做是 $0 - 1$ 损失函数的上界限，如下图所示：

正则化项 $R$ 的通常选择以下三种：
L2正则化: $R(w)=\frac{1}{2}\sum_{i=1}^{n}w_i^2$ L1正则化(产生稀疏解)： $R(w)=\sum_{i=1}^n|w_i|$ 弹性网络（Elastic Net,介于L1和L2之间） $R(w)=\frac{\rho}{2}\sum_{i=1}^{n}w_i^2+(1-\rho)\sum_{i=1}^{n}|w_i|$ 下图展示了对于当 $R (w) = 1$ 时，三个不同的正则化项的参数空间轮廓：

后记：
损失函数是机器学习三要素（模型、策略、算法）中，策略一项的核心。最小化损失函数的期望（aka ，also known as 风险函数）是机器学习的目标。风险函数包括了经验风险和结构风险（正则化项，aka惩罚项）两部分。
根据理解加深，本文会逐步完善。

MiaL

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn官方文档1.5.7

scikit-learn 官方文档翻译学习1.5.7 数学公式给定一组训练实例(x1,y1),⋅⋅⋅,(xn,yn),(x_1,y_1),\cdot\cdot\cdot,(x_n,y_n),(x1,y1),⋅⋅⋅,(xn,yn),其中xi∈Rmx_i \in R^mxi∈Rm，和yi∈{−1,1}y_i \in \{-1,1\}yi∈{−1,1},需要学习目标函数f(x)=wTx+...
复制链接

扫一扫