dataframe一些简单方法

总结一下,最近用到的dataframe的简单的方法

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns=list('abc'))
print('df',df)
#1.对列进行操作,axis=1
df1 = df.apply(lambda x:x['a']*10 + x['b'],axis=1)
print('df1',df1)
#2.对行进行操作,axis=0
df2 = df.apply(lambda x:x[0]*10 + x[1],axis=0)
print('df2',df2)
#3.对行进行操作,增加判断条件,lambda+if
df3 = df.apply(lambda x:x[0]*10 + x[1] if x[0]>0 else x[0],axis=0)
print('df3',df3)
#4.扩展数据框的列
df['d'] = df1
print('df',df)
#5.扩展数据框的行,或者叠加两个数据框,使用append
df4 = df.append(df2,ignore_index=True)
print('df4',df4)
#6.分组,groupby里面的字段内的数据重构后都会变成索引,以a进行分组(a列为索引),对bc列进行求和。注意:groupby后一般需要带一个
# 方法mean(),sum(),first(),last()。
df5 = df4.groupby(['a'])[['b','c']].sum()
print('df5',df5)
#7.修改列名,也可使用rename
df4.columns = ['e','f','g','h']
print('df4',df4)
#8.修改索引名,也可使用rename
df4.index = list('56789')
print('df4',df4)
#9.获取列中有某特定元素的数据框,使用isin,获取c列元素值等于1和3的数据框
# df6 = df[df['c'].isin(['1','3'])]
#10.去重,drop_duplicates

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值