摘要: Python数据处理分析中,日期型数据的处理是相对复杂且非常重要的一环。本文以调用Tushare包获得股票的各种信息数据为案例,介绍日期数据的处理。
文章目录:
1. 获取数据2. 日期型数据处理2.1. 按日期切片筛选数据2.1.1. 按年度2.1.2. 按月度2.1.3. 按具体天2.2. to_period按日期显示数据2.2.1. 按年度2.2.2. 按季度2.2.3. 按月度2.3. resample按日期统计数据2.3.1. 按年度2.3.2. 按季度2.3.3. 按月度2.4. 统计和显示结合
之前的的一篇文章:10行代码爬取全国所有A股/港股/新三板上市公司信息,用爬虫实现了上市公司信息的抓取。但还有更简单的方法,就是调用Tushare包,可以很便捷地拿到干净的各种股市数据。
强烈推荐一下这款由国内团队开发的包,Github上目前Star数 6000+。Tushare是一个开源免费、强大的python金融财经数据接口包。调用该包返回的数据格式基本是Pandas DataFrame类型,非常便于后续处理分析。包的数据来源于新浪财经、腾讯财经、上交所和深交所,比较齐全,质量也很可靠。参考:
https://tushare.pro/document/2
https://github.com/waditu/Tushare
下面我们就来简单体检一下这款包的便利,然后利用它返回的数据处理其中的日期型数据。
1. 获取数据
接口使用前提:首先在官网注册成功后获得token,然后通过下面命令下载Tushare包,然后在程序中调用就可以使用了。
1 pip instasll tushare
可以获得的信息接口非常多,包括:行情数据、基础数据、财务数据板块等。
下面就简单使用下部分接口。首先,获取国内股票列表数据。1import tushare as ts
2ts.set_token('你的token')
3pro = ts.pro_api()
4data = pro.stock_basic(exchange_id='', is_hs='', fields='symbol,name,is_hs,list_date,list_status')
5print(data)
6# ''表示获取全部
exchange_id表示股票代码,可以获取特定股票的基础信息,为空则获取全部;is_hs表示是否沪深港通,为空表示提取所有股市;fields表示想要提取的信息列表。
结果如下:
1 ts_code symbol name list_status list_date is_hs
20 000001.SZ 000001 平安银行 L 19910403 S
31 000002.SZ 000002 万科A L 19910129 S
42 000004.SZ 000004 国农科技 L 19910114 N
53 000005.SZ 000005 世纪星源 L 19901210 N
64 000006.SZ 000006 深振业A L 19920427 S
75 000007.SZ 000007 全新好 L 19920413 N
86 000008.SZ 000008 神州高铁 L 19920507 S
97 0000