PySpark入门十九：ML评估器之回归与聚类

最新推荐文章于 2022-03-12 09:07:07 发布

Roc Huang

最新推荐文章于 2022-03-12 09:07:07 发布

阅读量469

点赞数

分类专栏： PySpark从入门到放弃数据分析文章标签： spark hadoop

本文链接：https://blog.csdn.net/weixin_43790705/article/details/108564996

版权

49 篇文章 58 订阅

订阅专栏

23 篇文章 43 订阅

订阅专栏

ML中可用于回归的有七种模型：

AFTSurvivalRegression：适合加速失效时间回归模型。是一个参数化模型，假设其中一个特征的边际效应加速或减缓了预期寿命。适用于具有明确阶段的过程。
DecisionTreeRegressor：类似于分类模型，明显不同的是其标签是连续的而不是多项的。
GBTRegressor：与 DecisionTreeRegressor 一样，区别在于标签的数据类型。
GeneralizedLinearRegression: 广义线性回归是具有不同内核功能的线性模型家族。与假设误差项的常态性的线性回归相反，GLM允许标签具有不同的误差项分布：gaussian、binomial、gamma和poisson家族的误差分布；
IsotonicRegression: 这种回归拟合一个形式自由、非递减的行到数据中。对于拟合有序的和递增的数据集是有用的；
LinearRegression：最简单的线性回归模型，假设了特征与连续标签以及误差项的常态之间的线性关系；
RandomForestRegressor：适合连续标签，而不是离散标签

无监督学习模型，用于查找数据中的关系。包含了四种模型：

关注

专栏目录