资金流时序分析-01数据探索与分析

总体概述

《数据探索与分析》主要内容是对原始数据及可选特征分析。对翌日特征、月特征、日期特征、节假日特征、节假日周边特征等与购买量和赎回量进行了可视化趋势性分析。

具体过程

数据预处理

  1. 导入数据
  2. 添加时间戳
  # 为数据集添加时间戳

data_balance['date'] = pd.to_datetime(data_balance['report_date'], format= "%Y%m%d")
data_balance['day'] = data_balance['date'].dt.day
data_balance['month'] = data_balance['date'].dt.month
data_balance['year'] = data_balance['date'].dt.year
data_balance['week'] = data_balance['date'].dt.week
data_balance['weekday'] = data_balance['date'].dt.weekday

特征分析

  1. 时间序列分析
    对原始数据的购买量、赎回量进行可视化分析;
    在这里插入图片描述

  2. 翌日特征分析
    选取每天的数据,对每周第二天的数据进行统计分析,包括小提琴图、正态分布图、中位数特征、箱体图等;最后采用斯皮尔曼相关性对第二天数据与购买量及赎回量进行相关性分析;

  3. 月特征分析
    对一年中每个月的购买量和赎回量进行统计分析;然后将每月的总量转为了概率分布,下图为每月购买量的概率密度曲线。
    在这里插入图片描述

  4. 日特征分析
    对每个月的购买量和赎回量进行统计分析;从中可以看出某些天存在异常点。如第一天、第二天、第16天等,同时对这些天的异常原因进行了说明;

14年8月购买量分布图热力图
热力图中可以看到第四周的周六的数据有异常,赎回量非常小。后面对这个数据分析发现是五一后上班的第一天。

  1. 节假日分析
    对节假日次日及附近的日期购买量与赎回量进行了分析;

  2. 异常值分析
    对每个月单笔最大、最小交易及总交易额进行分析;
    在这里插入图片描述

  3. 用户交易中的其他变量分析

  4. 银行及支付宝利率的分析
    支付宝利率影响购买量;
    银行利率印象赎回量;
    支付宝利率影响短;
    银行利率影响长;

特征总结

  1. 确定备选特征;需要从原始数据进行多维度进行分析。
  2. 对备选特征与所预测目标的趋势性进行相关性分析;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
// 循环工作表Sheet for (int numSheet = 0; numSheet < hssfWorkbook.getNumberOfSheets(); numSheet++) { //o--对应第一张工作表如默认情况下sheet1 hssfSheet = hssfWorkbook.getSheetAt(numSheet); //System.out.println("表明"+hssfSheet.getSheetName()); if (hssfSheet == null) { continue; } //首先获得第一行的数据 HSSFRow rowFirst=hssfSheet.getRow(0); // 循环行Row for (int rowNum = 1; rowNum <=hssfSheet.getLastRowNum(); rowNum++) {// //获取行对象 HSSFRow hssfRow = hssfSheet.getRow(rowNum); if(hssfRow!=null) { //构建comp对象 CompShows comp=new CompShows(); //初始化所有comp默认为1 comp.setTypeOfTransaction(1); //根据列单元格的名字规划数据 int t=hssfRow.getLastCellNum(); // System.out.println(t+"fffffffffffffsssssssssssss"); for(int i=0;i<t;i++) { //遍历根据i获得数据和列名 HSSFCell hcFirst=rowFirst.getCell(i); // System.out.println(getValueForString(hcFirst)+"========"); //if("客户帐号".equals(hssfrow)) //获得每一列的列名 HSSFCell hc=hssfRow.getCell(i); if("客户名称".equals(getValueForString(hcFirst).toString())||"户名".equals(getValueForString(hcFirst))||"交易户名".equals(getValueForString(hcFirst))) { //System.out.println("客户账号"+getValue(hc)); //表示该列数据存储的是账户名 comp.setName((String)getValueForString(hc)); }else if("账号".equals(getValueForString(hcFirst))||"客户帐号".equals(getValueForString(hcFirst))||"交易账号".equals(getValueForString(hcFirst))) { //表示该列数据存储的是账号 comp.setAccount((String)getValueForString(hc)); //System.out.println("账号"+getValue(hc)); }else if("交易日期".equals(getValueForString(hcFirst))||"交易时间".equals(getValueForString(hcFirst))) {

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值