python dataframe (数据处理一些常用的)

本文涵盖了Python DataFrame的一些常用操作,包括合并多个DataFrame、选取另一DataFrame中的数据、去重和处理缺失值、rename功能、Series转DataFrame、join操作以及数据的输入输出。通过这些技巧,可以高效地进行数据处理和分析。
摘要由CSDN通过智能技术生成

1. 合并多个dataframe

d1、d2、d3、d4是dataframe

// 
frames=[d1,d2,d3,d4]
total=pd.concat(frames)

2.选择在另一个dataframe的数据

d5=total[d4["id"].isin(d3["id"])]

3.针对dataframe的某一列去重、drop na,保留重复的第一个

total1=total.drop_duplicates(["id"],keep="first")
total2=total.dropna(subset=["id"])

4. dataframe. rename

total3=total1.rename(columns={"id":"id_code"})

5.series 转变成 dataframe

id=total1["id"].to_frame()

6.join

d3=d1.join(d2.set_index('id'), on='id')

7.输入、输出

d1=pd.read_csv("d1.csv", encoding='latin-1')## encoding according to the type of data 
d1.to_csv("d1",index=False)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值