资金流入流出预测-挑战Baseline
想法仅供参考
本次数据仅使用了其中的每日进出总额
思路:依据每日进出总额进行分析,首先会发现在2014年2月份及以前波动较大,考虑只选择后面的数据进行分析
很明显,这些数据符合时间序列相关模型
1,通过点线图可能明显地看出其周期性变化趋势(这也是由于业务关系导致的),明显存在一个星期周期性(一个星期为1个 周期);同时可能还存在另一个周期(一个自然月天数为一个周期)
2,通过计算周期系数;(本文为非标准计算方法,标准方式请参考统计学相关教材)
3,选择基数(本人选的是均值)
4,添加随机扰动项(本人未添加)
5,通过乘法加成计算最终值
6,模型优化:考虑9月底接近国庆长假,最后几天的值可能会有较大的变动(可适当进行调整,本人未处理)
7,本段代码跑出的数据在挑战baseline第一赛季得分135.5分,可以排名前十;在资金流入流出预测的第一赛季也是处于前五的分数
8,思路补充,由于9月8日中秋放假时间是6-8日,且8日为周一,理论上来说节假日余额宝会顺延确认份额(待验证)
rm(list=ls())
for (i in 1:5) gc()
library(data.table)
library(plyr)
user_money<-fread("D:/Documents/yue/Purchase&Redemption Data/user_balance_table.csv",data.table = FALSE)
riqi<-unique(user_money$report_date)
riqi<-riqi[order(riqi)]
user_money$month<-0
user_money$day