python数据处理-整理表格数据

利用python整理表格数据

由于疫情数据量大,且时间跨度大从2020.1.23-2020.2.2日,可以利用‘’日期‘标签进行筛选:
首先需要python环境以及都三方库pandas
一下是实现代码:

import pandas as pd
data=[]
dfd = pd.read_excel('F:\gbh\python\practice\大创\data\武汉疫情数据\迁徙.xlsx')
#dfd.head(10)
index=
dfd['日期'] = pd.to_datetime(dfd['日期'].astype('str'))
time=['2020-01-24','2020-01-25','2020-01-26','2020-01-27','2020-01-28','2020-01-29','2020-01-30','2020-01-31','2020-02-01','2020-02-02','2020-02-03']
for i in range(12):
    index+=1
    data_china = dfd[dfd['日期'] == time[i]]
    print(data_china)
    data.append(data_china)
    #data_china.to_csv('E:\data_tengxun\迁徙1.23.csv',index=0,encoding='utf_8_sig')
    data_china.to_csv('E:\data_tengxun\迁徙1.2'+str(index)+'.csv',index=0,encoding='utf_8_sig')  

以上代码实现批量筛选
如果是单独筛选,可以使用一下代码实现:

import pandas as pd
data=[]
dfd = pd.read_excel('F:\gbh\python\practice\大创\data\武汉疫情数据\迁徙.xlsx')
#dfd.head(10)

dfd['日期'] = pd.to_datetime(dfd['日期'].astype('str'))
#time=['2020-01-24','2020-01-25','2020-01-26','2020-01-27','2020-01-28','2020-01-29','2020-01-30','2020-01-31','2020-02-01','2020-02-02','2020-02-03']
data_china = dfd[dfd['日期'] == '2020-02-03']
print(data_china)
data.append(data_china)
#data_china.to_csv('E:\data_tengxun\迁徙1.23.csv',index=0,encoding='utf_8_sig')
data_china.to_csv('E:\data_tengxun\迁徙2.03.csv',index=0,encoding='utf_8_sig')  

运行结果
运行结果在这里插入图片描述

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值