自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 SARIMA时间序列预测

每个变量的P值均小于0.01,所以在0.01的显著性水平下,拒绝加假设,模型中每个变量的系数通过显著性检验,可以认为拟合的模型中包含这些变量是合理的。结合以上两种方法:A R ( p ) + M A ( q ) = A R M A ( p , q ) AR§+MA(q)=ARMA(p,q)AR§+MA(q)=ARMA(p,q),就是自回归移动平均模型。MA(q) 移动平均模型,是对时间序列的误差进行建模,并假设当前误差取决于带有滞后的误差。和小 p 不同的是,需要看的是季节长度的倍数上的时滞。

2024-03-21 18:27:08 604

原创 ARIMA 时间序列模型在实际场景中的试验

确定性因素分解的方法把所有序列的变化都归结为 4 个因素(长期趋势、季节变动、循环变动和随机波动)的综合影响,其中长期趋势和季节变动的规律性信息通常比较容易提取,而由随机因素导致的波动则非常难以确定和分析,对随机信息浪费严重会导致模型拟合精度不够理想。当数据之间的相似性越明显,对于模型训练的效果是更佳,如果不介意,也可以先把商品分好类,按类目一个个预测,最后汇总也能得到大盘的达成率。在这里数据是显示平稳的,但是后面训练模型的时候,平稳性变差,所以还是可以做差分,得到一个更加平均的序列。

2024-03-17 00:14:10 1693

原创 hive sql案例练习一

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录hive sql案例练习一一、各年评分最高的电影类型(年份,类型,影评分)1、思路2、代码二、该影评库中各种类型电影中评价最高的 5 部电影(类型,电影名,平均影评分)1.思路2.代码总结hive sql案例练习一数据源数据解释t_movie电影ID::电影名(年份)::标签1|标签2…movieid moviename movietypet_rating用户ID::电影ID::评分::评分的时.

2022-05-07 12:37:34 1798

原创 淘宝用户行为数据分析

系列文章目录第二章 淘宝用户生命周期分析文章目录系列文章目录一、项目背景二、项目目的三、理解数据二、分析思路三、用户生命周期分析1、 用户活跃规律(1)不同日期的网页浏览量和访问量情况(2)分析(3)不同日期的网页浏览量和访问量情况(4)分析2、用户留存规律(1)跳失率(2)分析(3)留存率(4)分析3、用户购买情况(1)复购率(3)分析(4)购买频次分析(5)分析(6)复购特征分析(7)分析总结一、项目背景随着互联网行业快速发展,其中电商已成为消费的主要趋势,并且电商板块收入已经成为企业新的主

2022-04-24 23:35:24 325

原创 随机森林文本分类

随机森林原理及代码实现 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录随机森林原理及代码实现前言一、集成算法是什么?二、随机森林是什么三、 数据预处理3.1 先来看一下我们的文本数据3.2 预处理3.3 统计评论情感值积极与消极的占比二、使用步骤参数介绍(4个)属性1.引入库2.参数调参方法总结前言提示:这里可以添加本文要记录的大概内容:例如

2022-04-10 10:46:21 4986 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除