自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 资金流时序分析-06学习总结

总结前言参加时序模型的项目已经有半个月了,开始的还能跟上,从第三章到第六章难度略大(第四章ARMA算法由于之前接触过,只大概看了一下代码)。开始的时候看第三章很费劲,对里面的base总是难以理解,后来根据给的参考网站及自己查阅相关资料基本弄明白了,其实第三章跟第五章的部分内容也有点关联性,第三章计算出来的周期因子直接作为了第五章的一个特征。这里面也不是一次看懂的,后来反复看了好几遍,好多天基本弄懂了。第二次卡壳的地方是第五章,这个地方是投入时间最多的,重新把代码一句一句的看,通过调试查看中间变量的值,经过

2020-09-04 18:03:20 319

原创 资金流时序分析-04特征工程

1、higher_feature_temp?2、\(处于行尾位置)可以理解为续行符;3、 name_list = []Tn_list = []p_list = []4、我们可以在 for 语句后面跟上一个 if 判断语句,用于过滤掉那些不满足条件的结果项。>>> L = [1, 2, 3, 4, 5, 6]>>> L = [x for x in L if x % 2 != 0]>>> L[1, 3, 5]...

2020-08-31 14:14:13 130

原创 资金流时序分析-03时间序列规则

base到底是什么意思?1.1 周期因子的第一种计算方法:1)除周均值 2)按列取中位数预测时的值就是base*中位数。从这个角度base就是一个固定值了,PPT中base来自最后一周每天的的平均值(=100);1.2周期因子的第二种计算方法:1)获取每日(工作日或周末)均值,2)再除以整体均值。直接用最后一周的平均客流量作为base并不一定是最好的方法。也许最后三天或最后五天的均值能更好的反映最新的情况。但是,我们不能直接对最后三天客流量取均值(最后三天是周末,这样取的base就偏大了)。需要去.

2020-08-25 07:47:07 603

原创 资金流时序分析-02数据探索与分析

资金流入流出学习心得总体概述特征分析总体概述从数据本身及用户的特征角度进行分析、购买方式等。特征分析数据导入将user_balance_table.csv数据导入;特征分析1)对大额、小额量进行分析;2)对频繁交易进行分析;3)冷启动(个人理解为新用户)与老用户的交易量分析;4)城市购买量与赎会量随时间的关系。(一共只有5个城市?)5)不同时间男女之间的购买量与赎会量区别;6)星座的影响7)利息的增长/直接购买量的影响;8)支付宝利率的影响;(与第一章有什么区别?)9)

2020-08-19 22:29:45 309

原创 资金流时序分析-01数据探索与分析

资金流入流出学习心得总体概述具体过程数据预处理特征分析特征总结总体概述《数据探索与分析》主要内容是对原始数据及可选特征分析。对翌日特征、月特征、日期特征、节假日特征、节假日周边特征等与购买量和赎回量进行了可视化趋势性分析。具体过程数据预处理导入数据添加时间戳 # 为数据集添加时间戳data_balance['date'] = pd.to_datetime(data_balance['report_date'], format= "%Y%m%d")data_balance['day'

2020-08-18 10:08:56 324

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除