pandas操作1(读csv不要索引/写csv不要索引/删除有空值行/按时间排序)

读csv不要索引(index)

在使用pandas读csv(read_csv())时,会默认产生一列索引,当你要把处理过后的csv文件生成一个新的csv文件时,就会多出一列索引值且这一列没有名字,不方便通过drop(columns=[‘name’])来删除,可以一开始在读的时候就让它不要产生索引(index_col=0)。

df = pd.read_csv('filename.csv', encoding='utf-8', index_col=0)

写csv不要索引

同样在生成csv文件时(to_scv())也可以避免生成索引列,方法为添加参数(index=False)

df.to_csv('C:/filepath/xxx.csv', index=False)

删除有空值的行

做数据分析的时候遇到有的行的某个关键值为空,那最好删除掉一整行以免影响后面的操作。

df1 = df.dropna(subset=['列名'])

按时间排序

有的数据可能是与时间先后顺序有关,需要按照时间先后顺序排序,这时候需要先把带有时间的列转为date_time格式,再进行排序。

df1['time'] = pd.to_datetime(df1['time'])
df1.sort_values('time', inplace=True)

inplace代表是否更改数据,默认是False,要保存结果的话需要inplace=True。

其他操作

pandas操作2(增加列并赋值/两列时间相减/按时间合并且求和)

pandas操作3(插入列insert/统计出现次数value_counts)

pandas操作4(处理缺失值,位置索引)

  • 23
    点赞
  • 78
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值