删除dataframe_DataFrame(7):DataFrame运算——逻辑运算

1、DataFrame逻辑运算

  • 逻辑运算符号:>  >=   <   <=   ==   !=
  • 复合逻辑运算符:&   |   ~
  • 逻辑运算函数:query()、isin()、between()
  • 逻辑运算的作用:利用逻辑运算,用于筛选数据(很重要)

2、原始数据文件

下载链接:

https://alltodata.cowtransfer.com/s/61ac037949ee4d

读取数据:

df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

结果如下:02ed2f5f70c23e8052c46460781f6827.png

3、逻辑运算符的案例说明

1)筛选出“数学成绩大于等于60并且英语成绩大于等于70”的记录

df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = (df["数学"]>=60) & (df["英语"]>=70)
display(x)

df1 = df[(df["数学"]>=60) & (df["英语"]>=70)]
display(df1)

结果如下:b3da6071614dae306abb3e1c1127e731.png

2)筛选出“语文成绩小于60或者数学成绩大于80”的记录

df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = (df["语文"]<60) | (df["数学"]>80)
display(x)

df1 = df[(df["语文"]<60) | (df["数学"]>80)]
display(df1)

结果如下:26af7f24dcf151ef79d53531e38c63f4.png

3)筛选出“语文成绩里面的非空记录”的记录

(这种方式很重要)

# 自己在原始数据中,任意删除三个值,重新读取即可
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = df["语文"].isnull()
display(x)
y = ~df["语文"].isnull()
display(y)

df1 = df[~df["语文"].isnull()]
display(df1)

结果如下:93c6c140b53cea6bfd6a3f0c7b9bc3f7.png注意:isnull()判断某个值是否为空,如果是返回True,否则返回False。

4、逻辑运算函数:query()、isin()、between()

1)query()函数:能够简化查询代码,很好用

df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df1 = df.query("语文>=60")
df1

df1 = df.query("语文>=60 & 数学>=60")
df1

结果如下:39e3afb53ab76342f07bfc482b9d92b7.png

2)isin()函数:查看df中是否某含某个值或者某些值

① isin()函数说明

使用isin()函数,不仅可以针对整个df操作,也可以针对df中的某一列(Series)操作,但是针对Series的操作才是最常用的。

② 利用isin()判断整个df中是否包含某个值或某些值(了解)
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df.isin(["60","70"])

结果如下:dcf323328d0e53b74e1ed82eb19e3d17.png

③ 利用isin()判断df中的某列是否包含某个值或某些值(掌握)
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df["语文"].isin(["37","97"])

df1 = df[df["语文"].isin(["37","97"])]
display(df1)

结果如下:174440ac0977673ae80e5c0a4cc8ea8f.png

④ 利用isin(),利用df1中的某一列,来对df2中的数据进行过滤(很重要)
df1 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df1)

df2 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=1)
display(df2)

x = df1["name"].isin(df2["name"])
display(x)

df1[df1["name"].isin(df2["name"])]

结果如下:4a74e254a4b19c20c959ee050810d70e.png

3)between()函数:返回一个布尔值,即如果在该范围内,返回True,否则返回False。

df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df)

df["数学"].between(50,70)
df[df["数学"].between(50,70)]

结果如下:a34384c0898e525bbf9ea46a362ebc52.png注意:此函数范围是左闭右闭区间。

a3f1cdde2a72a0a78336ebf377ea98cc.gif

DataFrame(1):DataFrame结构的详细介绍

DataFrame(2):DataFrame常用属性说明

DataFrame(3):DataFrame的创建方式

DataFrame(4):DataFrame元素的获取方式

DataFrame(5):DataFrame的增、删、改、查

DataFrame(6):DataFrame运算——算术运算

b118fb882d5a0b9c44fa706925feeb25.gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值