本文我们一起用python来对某只股票的所有历史日数据,做一个探索性的分析,看看能不能有一些有趣的发现,希望能激起你对金融数据分析的兴趣。主要用到numpy,pandas模块的一些基本用法。本文的所有数据,包含所有A股的日数据,在文末有下载。
一、熟悉数据集
我们先导入需要的模块,然后用pandas的read_csv方法载入数据集。
观察数据集,包含了代码为000001的股票(平安银行)从上市至今的共6000多天的交易记录,包括每个交易日的交易日期,四个价格(最高,最低,开盘,收盘),涨跌(比),以及交易量和交易额。可以说,有了上面这些数据,可以造出任意一个技术分析指标。
画个收盘价的均线图试试看:
上文代码解释:我们先把“trade_date“这一列调整为时间格式,再把它设置为index。然后用df.rolling().mean()计算移动平均数。最后为了现实清晰,选取6500行以后的三个数据进行可视化显示。
二、初步探索数据集
1.看一下目前的价格处于历史中的什么价位
知道了一只股票的价格目前相对最高最低价所处的位置,我们就可以据此对它有一个总体的认识。我们还可以把上面的代码封装成一个函数,函数的输入是股票代码,然后遍历所有的股票,这样我们就可以挑选出我们需要的股票进行进一步研究。比如你想要超低价股,那么可以把p小于5%的股票打印出来,如果想要历史最高价的股票,那就是p=1.
2.选择合适的移动平均数