python处理大型csv文件——pandas数据分析(含有毫秒的时间类型转换,根据需求显示年月日,显示全部行和列,某列频数统计)

本文介绍了如何使用Python的pandas库处理大型CSV文件,包括分块读取数据,将时间列转换为datetime类型,只显示年月,并通过设置选项显示所有行和列。此外,还展示了对某一列的频数统计和结果的可视化。代码中包含了设置显示选项、重命名列以及进行频数统计和可视化的方法。
摘要由CSDN通过智能技术生成

打开一个数据集,df=pd.read_csv(‘filename.csv’) #数据集较大时候用分块读取数据方法chunksize=1000,iterator=True
数据集内容为:
A B C D
0 ID_1 ID_2 2015-12-23 12:15:20.799 23
1
.
.
.
查看其中的数据格式print(df.dtypes),C列本是时间,但显示为object类型
A object
B object
C object
D int64
dtype: object

所以要转换为datetime类型,df[‘C’] = pd.to_datetime(df[‘C’]) prinr(df.dtypes)
A object
B object
C datetime64[ns]
D int64
dtype: object

查看数据集中年月日的情况 print(df[‘C’].dt.year.unique(),df[‘C’].dt.month.unique(),df[‘C’].dt.day.unique())

转化时间为只显示年-月:df[‘C’] = df[‘C’].map(lambda x: x.strftime(’%Y-%m’))#’%Y-%m-%d %H:%M:%S.%f’ 年-月-日 时:分:秒.毫秒
index C
941750 2016-03
941751 2016-03
941752 2016-03

完整代码:
import time
from datetime import

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值