数据介绍
上一节我们已经介绍过了“基于企业现金流预测的投资决策”的项目背景,并且做了业务需求分析和算法搭建框架梳理。接下来我们来梳理一下我们用到的数据长什么样子,并做一个简单的探索性分析。
环境准备:
- python >= 3.7
- pandas >= 1.1.3
- numpy >= 1.19.2
- prophet 1.0
- matplotlib >= 3.3.2
- jupyter_nbextensions_configurator (非必须, 推荐安装)
数据探索性分析
from prophet import Prophet
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
Backend TkAgg is interactive backend. Turning interactive mode on.
# cashflow_data: 每家子公司/每天/每种中类型的现金流入和流出数据
## date: 日期
## cashflow_category: 现金流类型-父类
## cashflow_subcategory: 现金流类型-子类
## cashflow: 现金流
## branch_id: 子公司ID
cashflow_data = pd.read_csv('data/cashflow_data.csv', parse_dates=['date'])
cashflow_data.head(2)
Out[5]:
date cashflow_category cashflow_subcategory cashflow branch_id
0 2015-04-01 cash_in sales 275765.184075 1
1 2015-04-02 cash_in sales 255256.272380 1