12、python数据框中数据有条件的抽取、组合抽取

记录抽取:对数据进行抽取
记录抽取数据公式:dataframe[condition]

condition 过滤的条件
返回值: dataframe

条件类型:

01 比较运算 <>=
02 范围运算 between[left,right]
      df[df.comments.between(100,1000)]
03 控制匹配 pandas.isnull(column)

      例如:df[pandas.isnull(df.title)]

常见类型

1 字符匹配:

str.contains(patten,na=false)

例如:df[df.title.str.contains('电台',na=false)]

2 逻辑运算

与(&),或(|)取反(not)

例如:df[(df.comments>=1000)&(df.comments<=10000)]

01 单条件

df[df.comments>10000]

02 多条件

df[df.comments.between(1000,10000)]

03 过滤空值所在行
import pandas

df[pandas.isnull(df.title)]


04 根据关键词替换 ~取反的意思,na代表空值,不需要进行匹配过滤

df[~df.title.str.contains('台电',na=False)]

05  组合逻辑

df[(df.comments>1000)&(df.comments<10000)]

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值