Pandas DataFrames筛选数据

最新推荐文章于 2024-02-02 09:27:45 发布

伙伴几时见

最新推荐文章于 2024-02-02 09:27:45 发布

阅读量467

点赞数

分类专栏： python data Analysis

python data Analysis 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

[python]view plain copy 
   
 </pre><span style="font-size:18px">最近突然发现了pandas真实特别好用，实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型（二维）或者Series类型（一维)。今天在百度经验里看到了DataFrame的数据筛选，自己也尝试了下，顺便记录下来。</span><p></p><p><span style="font-size:18px">1.先加载os包，打开一个csv文件，读出其中内容</span></p><p></p><pre name="code" class="python">import os  
 import pandas as pd   
 aqicsv = pd.read_csv("D:\\aqifit_numsum10\\newaqifit.csv")  

2.此时的aqicsv为DataFrame格式,可进行describe操作，获得一些统计上的指标

[python]view plain copy 
   
 aqicsv["predictaqi_norm1"].describe()  

3.可筛选出predictaqi_norm1这一列大于100的行

[python]view plain copy 
   
 aqicsv[aqicsv["predictaqi_norm1"]>100]  

[python]view plain copy 
   
 <span style="font-family: Arial, Helvetica, sans-serif;"></span><pre name="code" class="python"><span style="font-family: Arial, Helvetica, sans-serif;">aqicsv[aqicsv.predictaqi_norm1>100]</span><span style="font-family: Arial, Helvetica, sans-serif;"> </span>  

4.可使用&（并）与| （或）实现多条件筛选

[python]view plain copy 
   
 aqicsv[(aqicsv["FID"]>37898) & (aqicsv["FID"]<38766) ]  

[python]view plain copy 
   
 aqicsv[(aqicsv.predictaqi_norm1>150) |(aqicsv.predictaqi_norm1<100) ]  

5.如果只需要其中两列数据，而同时利用另外两列进行筛选时可以这样.如果只需要其中的某几列可以写为aqicsv[['FID','x','y']]

[python]view plain copy 
   
 aqicsv[['x','y']][(aqicsv.FID >10000) | (aqicsv.predictaqi_norm1 >150)]  

6.可用isin方法筛选一些特定值，但要将其写入某一列中

[python]view plain copy 
   
 testlist = aqicsv.predictaqi_norm1[:50]  

[python]view plain copy 
   
 aqicsv['predictaqi_norm1'].isin（testlist）  

伙伴几时见

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas DataFrames筛选数据

[python] view plain copy"font-size:18px">最近突然发现了pandas真实特别好用，实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型（二维）或者Series类型（一维)。今天在百度经验里看到了DataFrame的数据筛选，自己也尝试了下，顺便记录下来。"font-size:18px">1.先加载os包，打
复制链接

扫一扫