PySpark销量预测实战
文章平均质量分 95
fitzgerald0
太阳出来的时候尽管我帮不上忙,此时唯一重要的是,日出时有你在场。
展开
-
(时间序列)回归模型融合策略
机器学习回归预测中,存在多个模型预测结果,我们可以选择最优的模型结果 ,也可以组合多个不同模型结果,研究表明,在许多情况下,只需对不同预测方法的预测结果进行平均就可以显著提高预测精度。同时达到最优模型的效果。原创 2022-02-21 22:42:51 · 4283 阅读 · 0 评论 -
销量预测建模中常用的损失函数与模型评估指标
本文详细的梳理了销量预测领域常见的损失函数和模型评估指标。原创 2021-04-06 21:49:43 · 2468 阅读 · 0 评论 -
PySpark机器学习调参方法
PySpark.ML调参方法(CrossValidator与TrainValidationSplit)原创 2021-05-06 13:54:05 · 1891 阅读 · 0 评论 -
PySpark线性回归与广义线性模型
本节从原理和代码上讲解销量预测任务中使用到的Spark.ML内置线性回归模型和广义线性模型。原创 2021-05-06 12:31:01 · 1659 阅读 · 0 评论 -
销量预测简单模型
销量预测常用简单模型总结,基于python和Spark.SQL原创 2021-04-20 20:58:02 · 5413 阅读 · 0 评论 -
PySpark机器学习特征选择
本文基于SPARK.SQL和SPARK.ML实现常见的4种结构化数据特征选择方法,并给出基于树模型的特征选择代码。原创 2021-04-19 23:01:04 · 2267 阅读 · 1 评论 -
PySpark.ml时间序列特征工程
PySpark.ml时间序列特征工程原创 2021-05-06 14:43:07 · 2222 阅读 · 0 评论 -
Spark.SQL时间序列缺失值填充与异常值处理
PySpark时间序列缺失值填充与异常值修复原创 2021-04-30 17:14:03 · 3629 阅读 · 1 评论 -
PySpark时间序列数据统计描述,分布特性与内部特性
为更好的洞察和处理大规模时序数据的特性,本文针对大规模时序数据,从基本统计特性,分布,序列内部检测三方面,提供Spark和借助numpy,scipy,statsmodels封装的成UDF函数脚本与理论讲解原创 2021-04-24 14:29:58 · 2003 阅读 · 0 评论 -
PySpark与DataFrame简介
PySpark与DataFrame简介原创 2021-05-06 15:34:54 · 2196 阅读 · 5 评论