刚开始接触数据分析的时候,我只会用pd.read下载好的数据,其实数据有很多种获取方法,在老师的介绍下,我了解到了tushare,比去其他渠道下载数据在到python使用方便很多。tushare账号ID:455337
下面介绍一下tushare基本使用方法。
首先安装tushare后引入,这里简称tushare为ts
pip install tushare
import tushare as ts
查看单只股票的进本信息,可设定起始日期和结束日期
ts.get_hist_data('600648',start='2020-1-1',end='2021-6-20')
输出结果如下,包括了开盘价、收盘价、最高价、最低价等几乎所有可能用到的基本信息,足够日常分析使用。而且数据格式清晰标准,可以直接使用,无需手动调整。
还可以ktype字段指定查找数据的频率:w代表周数据,d代表日数据
ts.get_hist_data('600648',ktype='w')
ts.get_hist_data('600648',ktype='d')
输出结果分别如下,可以看出使用w查找时索引日期不是连续的,而以d为条件查找时索引日期是连续的。
此外,还可以使用tushare查询指数信息
ts.get_index()
以上基本语句足以应付完成日常的课程作业,tushare还有更多数据可以用于更高阶层次的分析。
例如可以获得股吧数据,这里以新浪为例,以下语句可以获取评论留言,可用于投资者情绪分析等,直接剩下了自己爬虫的功夫。
ts.guba_sina()