dataframe 筛选_一点一滴学python(3):Pandas DataFrames筛选数据

最近突然发现了pandas真实特别好用,实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型(二维)或者Series类型(一维)。今天在百度经验里看到了DataFrame的数据筛选,自己也尝试了下,顺便记录下来。

  • 先加载os包,打开一个csv文件,读出其中内容
import 

5d1ed312eda8ea2443a19d24b3ec6973.png
  • 此时的aqicsv为DataFrame格式,可进行describe操作,获得一些统计上的指标
aqicsv["predictaqi_norm1"].describe()

f8abea9fea28c1c86410ffde0e45ad5f.png
  • 可筛选出predictaqi_norm1这一列大于100的行
aqicsv[aqicsv["predictaqi_norm1"]>100]

4cdd13d92ea1c84b0f1877f234f792a3.png
  • 可使用&(并)与| (或)实现多条件筛选
aqicsv[(aqicsv["FID"]>37898) & (aqicsv["FID"]<38766) ]

aqicsv[(aqicsv.predictaqi_norm1>150) |(aqicsv.predictaqi_norm1<100) ]

ebd0fea3e5bbb9bde616b3a0c2a72254.png
  • 如果只需要其中两列数据,而同时利用另外两列进行筛选时可以这样.如果只需要其中的某几列可以写为aqicsv[['FID','x','y']]
aqicsv[['x','y']][(aqicsv.FID >10000) | (aqicsv.predictaqi_norm1 >150)]

2eff0b925731c0d3edb22029e2ceb408.png
  • 可用isin方法筛选一些特定值,但要将其写入某一列中
testlist = aqicsv.predictaqi_norm1[:50]

1118584c96f43ea386222aa4ca222f64.png
aqicsv['predictaqi_norm1'].isin(testlist)

217024718f861896163926a19a1b1c4f.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值