上一篇文章用Python对定投数据进行了处理,计算出了总的收益率随时间的变化数据,保存到了csv文件里。现在我们就开始对数据进行具体的分析。具体如何分析,我也没谱,是第一次,走到哪儿就算哪儿吧。首先,先建立一个git分支,在分支上编辑新代码,完成以后再合并。git分支功能我以前也没怎么用过,只是知道有这么个功能。搜了一下,又动手实验,成功了。先建立名为data_analysis的分支,然后转移到该分支中:
git branch data_analysisgit checkout data_analysis
或者可以直接新建分支并转移
git checkout -b data_analysis
然后就可以增加代码啦。新建一个data_analysis.py的文件,用于数据分析。先从csv文件中导入数据到DataFrame变量中,再输出看看。
import pandas as pd
etf_total = pd.read_csv("total_etf.csv")
etf_300 = pd.read_csv("300etf.csv")
etf_nas = pd.read_csv("nasetf.csv")
print(etf_total.head())
print(etf_300.head())
print(etf_nas.head())
没问题啦。再提交代码。最后将本地分支推送到github上。
git push -u origin data_analysis
再把数据可视化一下吧,先尝试一下各种不同的图形类型。
import matplotlib.pyplot as plt
#数据可视化
def Display(data):
fig = plt.figure()
ax1 = fig.add_subplot(2,2,1)
ax2 = fig.add_subplot(2,2