python pandas 对dataframe中的数据进行四则运算及筛选

对dataframe的行,列加减乘除四则运算

首先,构建一个dataframe

import pandas as pd
d={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,'c':11,'d':12}}
df=pd.DataFrame(d)
print(df)

输出结果为:

one two three
a 1 5 9
b 2 6 10
c 3 7 11
d 4 8 12

以加法为例,对dataframe进行处理

计算每一行的总和

df['sum']=df['one']+df['two']+df['three']
print(df)

输出结果为:

one two three sum
a 1 5 9 15
b 2 6 10 18
c 3 7 11 21
d 4 8 12 24

计算每一列的总和

df.loc['sum']=df.loc['a']+df.loc['b']+df.loc['c']+df.loc['d']
print(df)

输出结果为:

one two three sum
a 1 5 9 15
b 2 6 10 18
c 3 7 11 21
d 4 8 12 24
sum 10 26 42 78

pandas对数据的处理可以理解为是按整行或者整列进行处理的

对dataframe中的数据进行筛选

首先,重新构建dataframe

import pandas as pd
d={'one':{'a':1,'b':2,'c':3,'d':4},'two':{'a':5,'b':6,'c':7,'d':8},'three':{'a':9,'b':10,'c':11,'d':12}}
df=pd.DataFrame(d)
print(df)

输出结果为:

one two three
a 1 5 9
b 2 6 10
c 3 7 11
d 4 8 12

筛选出dataframe第三列大于10的行

df['three']>10
print(df)

输出结果为:

a False
b False
c True
d True
Name: three, dtype: bool

True代表的是dataframe中第三列大于10的行,False则代表小于等于10的行
这两行内容是什么呢?

df1=df[df['three']>10]
print(df1)

输出结果为:

one two three
c 3 7 11
d 4 8 12

筛选出dataframe第二列小于8,且(&)第三列又大于10的行

且是通过“&”来表示关系的,记得两个筛选条件加括号。

print((df['two']<8)&(df['three']>10))

输出结果为:

a False
b False
c True
d False
dtype: bool

df2=df[(df['two']<8)&(df['three']>10)]
print(df2)

输出结果为:

one two three
c 3 7 11

这就是筛选出来的行,但其并不是一个series,依旧是一个dataframe。

print(type(df2))

输出结果为:

<class ‘pandas.core.frame.DataFrame’>

筛选出dataframe第二列小于6,或(|)第三列又大于10的行

或是通过管道符“|”来表示关系的

print((df['two']<6)|(df['three']>10))

输出结果为:

a True
b False
c True
d True
dtype: bool

df3=df[(df['two']<6)|(df['three']>10)]
print(df3)

输出结果为:

one two three
a 1 5 9
c 3 7 11
d 4 8 12

筛选出dataframe中满足特定条件的元素

筛选出dataframe中大于5的元素

print(df>5)

结果为:

one two three
a False False True
b False True True
c False True True
d False True True

print(df[df>5])

结果为:

one two three
a NaN NaN 9
b NaN 6.0 10
c NaN 7.0 11
d NaN 8.0 12

筛选出dataframe在list=[2,4,6,8,10]中的元素

list=[2,4,6,8,10]
print(df.isin(list))

输出结果为:

one two three
a False False False
b True True True
c False False False
d True True False

print(df[df.isin(list)])

输出结果为:

one two three
a NaN NaN NaN
b 2.0 6.0 10.0
c NaN NaN NaN
d 4.0 8.0 NaN

  • 3
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值