小白一枚,金融大数据分析作业,顺便总结一下。
下面的数据以中国银行股票为例,其他股票的而分析方法类似。编程工具:Jupyter notebook
1. 导入数据分析包并设置好绘图工具属性
import pandas as pd
import matplotlib.pyplot as plt
import ffn #金融计算包
import tushare as ts#获取金融数据的工具包
%matplotlib inline
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
[/code]
# 2. 获取股票数据
tushare工具包可以获取股票数据,获取的数据一般只能是最近几年的股价数据。更早的数据获取不到,可以换用pandas的数据获取包。
```code
chinaBank = ts.get_hist_data('601988', '2018-01-01', '2019-01-01') #中国银行
chinaBank = chinaBank.sort_values(by='date', ascending=True) #数据转化为升序
Close = chinaBank.close
Close.head()
[/code]
# 3. 收益率
## 3.1 一期收益率
在计算之前,一定要确保日期索引是dataTime类型,否则可能出现计算出错的问题。
```code
#将索引值变换成日期型