先看效果
下图展示的是我用python爬取的英维克股票(编号是002837)的日k数据,是3年内的所有日k信息哦,而且最新的数据可以到最近一个交易日结束哦。
数据解释:
date:日期
open:开盘价
high:最高价
close:收盘价
low:最低价
volume:成交量
price_change:价格变动
p_change:涨跌幅
ma5:5日均价
ma10:10日均价
ma20:20日均价
v_ma5:5日均量
v_ma10:10日均量
v_ma20:20日均量
turnover:换手率[注:指数无此项]
可能你会觉得,要实现这个,应该要很长的代码来写吧。其实不然,爬取这些信息,并且把信息整整齐齐地存到电脑里,只需要两行简单的代码就行了。你别不相信,用的就是下面两行代码。
dd=tushare.get_hist_data(‘002837’) #爬取股票近三年的全部日k信息
dd.to_excel('002837'+'.xlsx') #将信息导出到excel表格中
注意,在调用这两行代码时,要引入必要的包,如下。
import xlwt
import xlrd
import tushare
如果你的python还没有安装这些包,自己去百度一下怎么用pip安装这些包吧,很简单很简单的。
代码讲解
第一行代码
dd=tushare.get_hist_data(‘002837’) #爬取股票近三年的全部日k信息
其实,这里面起关键作用的是tushare包。Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。如果你想进一步了解,可以搜索下面网址。
http://tushare.org/index.html
这个网站会教你更多更方便的获取股票数据和处理股票数据的方法。
第二行代码
dd.to_excel(’002837'+'.xlsx') #将信息导出到excel表格中
这个代码的目的,就是把爬取到的数据存入excel表格中,注意,爬取到的数据形式是dataframe,这个数据形式由列名(也就是第一行的表头),索引(第一列的日期),数值(其他地方的数据)三部分组成的。这三部分不是在一起的,所以在导出到excel表格的时候,要想好导哪一部分,还是三部分一起导。这里用的是默认选项,也就是三部分一起导。
to_excel的常用参数说明:
excel_writer: 文件路径或者ExcelWriter对象
sheet_name:sheet名称,默认为Sheet1
sep : 文件内容分隔符,默认为,逗号
na_rep: 在遇到NaN值时保存为某字符,默认为’‘空字符
float_format: float类型的格式
columns: 需要保存的列,默认为None
header: 是否保存columns名,默认为True
index: 是否保存index,默认为True
encoding: 文件编码格式
startrow: 在数据的头部留出startrow行空行
startcol :在数据的左边留出startcol列空列
最后,为了感谢tushare,就为它打一个广告吧。