Spark-ml LinearRegression

最新推荐文章于 2023-11-02 23:57:02 发布

王xm0323

最新推荐文章于 2023-11-02 23:57:02 发布

阅读量366

点赞数

分类专栏： MachineLearning spark 文章标签： 1024程序员节

本文链接：https://blog.csdn.net/qq_20245089/article/details/109242872

版权

spark 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

MachineLearning

3 篇文章 0 订阅

订阅专栏

参数说明:

参数elasticNetParam:

取值范围[0,1], 取值1用的是L1正则化,取值0用的是L2正则化,否则取值是elasticNet正则化,源码如下:

// LinearRegression的train方法中

val effectiveL1RegParam = $(elasticNetParam) * effectiveRegParam
val effectiveL2RegParam = (1.0 - $(elasticNetParam)) * effectiveRegParam

参数loss：使用square error还是huber

// default是SquaredError，可以设置为Huber
def setLoss(value: String): this.type = set(loss, value)
setDefault(loss -> SquaredError)

补充:

线性回归，是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式： $\bar{y} = WX+b$ ，其优化的目标是最小化损失函数，
可以用mean square error 均方误差(MSE)： $L= min MSE = min(\frac{1}{2n}\sum_{i=1}^{n} (\omega ^{i}x^i - y^i))^2$ ，引入正则项，为防止过拟合，一般需要加入正则项，有三种：
- L1正则项，此时线性回归又叫Lasso回归： $L= min(MSE + \alpha\sum_{j=1}^{n}\left \| \omega ^j \right \|)$
- L2正则项，此时线性回归又叫岭回归： $L=min(MSE+\alpha\sum_{j=1}^{n}\left \| \omega ^{j} \right \| ^2)$
- elastic Net 弹性网络，是在岭回归和Lasso回归中进行了折中，通过混合比 elasticNetParam ： $L = min(MSE + \lambda (\frac{1-\alpha }{\alpha }\left \| \omega\right \|^2+\alpha \left \| \omega \right \|)) = \min_{w}\frac{1}{2n}{\sum_{i=1}^n(X_{i}w - y_{i})^{2} + \lambda\left[\frac{1-\alpha}{2}{||w||_{2}}^{2} + \alpha{||w||_{1}}\right]}$
也可以用 Huber，方程是：，其中：
- Fitting with huber loss only supports none and L2 regularization. 只支持L2正则。

王xm0323

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark-ml LinearRegression

目录参数说明:参数elasticNetParam:原理补充: 什么是L1, L2, elasticNet正则化参数说明:参数elasticNetParam: 取值范围[0,1], 取值1用的是L1正则化,取值0用的是L2正则化,否则取值是elasticNet正则化,源码如下:// LinearRegression的train方法中val effectiveL1RegParam = $(elasticNetParam) * effectiveRegParamv...
复制链接

扫一扫

专栏目录