Tushare获取covid-19.csv
时间序列数据建模流程实例使用数据
单次访问最多仅能获取20200124到20200130日的2000条数据,所以使用for循环进行多次访问
数据源仅统计到20200322日的数据,总数据天数大概有两个月。在代码中每次访问一天的数据,访问70次获取全部的两个月的数据,之后再将数据拼接为完整数据。
# 使用pip安装tushare
# -*- coding: utf-8 -*-
import pandas as pd
import tushare as ts
import datetime
import time
import random
# 单次访问最多仅能获取20200124到20200130日的2000条数据,所以使用for循环进行多次访问
#需要在tushare免费注册一个账号,填入你的token即可调取数据
pro = ts.pro_api('ce6bfc4429b13c06677abf7528a9b8a3df407ee856c7789f86bdeb70')
df = pro.ncov_num(level=2)
begin_date = datetime.datetime.strptime('20200124', "%Y%m%d")
df_list = []
for i in range(70):
temp_date = (begin_date + datetime.timedelta(days=i)).strftime("%Y%m%d")
# print(temp_date)
df = pro.ncov_num(ann_date=temp_date)#最早是从2020年1月24日开始的数据
df_list.append(df)
time.sleep(random.random())
final_df = pd.concat(df_list)
final_df.rename(columns={'ann_date':'发布日期','area_name':'地区名称','parent_name':'上一级地区','level':'级别','confirmed_num':'累计确诊人数','suspected_num':'累计疑似人数','confirmed_num_now':'现有确诊人数','suspected_num_now':'现有疑似人数','cured_num':'累计治愈人数','dead_num':'累计死亡人数'},inplace=True) #修改表头
final_df.to_csv('covid-19.csv',index=False)#将其保存成CSV