总结了pandas提取数据的15种方法,统统只需1行代码,真香!

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取

python免费学习资料、代码以及交流解答点击即可加入


 

pandas是python数据分析必备工具,它有强大的数据清洗能力,往往能用非常少的代码实现较复杂的数据处理

今天总结了pandas筛选数据的15个常用技巧,主要包括5个知识点:
1.比较运算:==、<、>、>=、<=、!=
2.范围运算:between(left,right)
3.字符筛选:str.contains(pattern或字符串,na=False)
4.逻辑运算:&(与)、|(或)、not(取反)
5.比较函数:eq, ne, le, lt, ge, gt(相当于==,=!,<=,<,>=,>)
6.apply和isin函数

下面以超市运营数据为例,给大家逐个讲解

首先读取数据:

 

 

 

先看一下各列的数据类型:

 

 


下面以实际应用场景为例开始讲解:

1.筛选门店编号为'CDXL'的运营数据

①第一种方法,用比较运算符‘==’:

 

②第二种方法,用比较函数'eq':

 

2.筛选单价小于等于10元的运营数据

③第一种方法,用比较运算符‘<=’:

 

④第二种方法,用比较函数'le':

 

3.筛选销量大于2000的运营数据

⑤第一种方法,用比较运算符‘>=’:

 

⑥第二种方法,用比较函数'ge':

 

4.筛选除门店'CDXL'外的运营数据

⑦第一种方法,用比较运算符‘!=’:

 

⑧第二种方法,用比较函数'ne':

 

5.筛选2020年5月的运营数据

首先将日期格式化:

 

 

⑨第一种方法,用逻辑运算符号'>' '<'和'&':

Pandasdatetime64[ns]不能直接与datetime.date相比,需要用pd.Timestamp进行转化

 

 

⑩第二种,用比较函数'gt''lt'和'&':

 

⑪第三种,用apply函数实现:

 

⑫第四种,用between函数实现:

 

6.筛选“类别ID”包含'000'的数据

⑬第一种,用contains函数:

 

⑭第二种,用isin函数:

 

很遗憾,isin函数搞不定,因为它只能判断该列中元素是否在列表中

7.筛选商品ID以“301”开头的运营数据

⑮需要用contains函数结合正则表达式使用:

 

 

以上就是总结的pandas提取数据的15种方法,是否有你喜欢的呢?

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 可以使用pandas的read_csv函数来读取csv文件,然后使用head函数来获取前十数据。同时,可以使用matplotlib库的plot函数来绘制数据。 示例代码如下: ```python import pandas as pd import matplotlib.pyplot as plt # 读取csv文件 data = pd.read_csv('data.csv') # 获取前十数据 top_10 = data.head(10) # 绘制数据 plt.plot(top_10['x'], top_10['y']) plt.show() ``` 在上面的代码,'data.csv'是你的csv文件的文件名,'x'和'y'是你csv文件列名。这个代码会读取csv文件,提取前十数据,并绘制出来。 ### 回答2: 使用Pandas提取CSV文件前十数据并绘图的步骤如下: 1. 首先,我们要导入Pandas和Matplotlib库: import pandas as pd import matplotlib.pyplot as plt 2. 使用Pandas的read_csv函数将CSV文件读入DataFrame对象: data = pd.read_csv('文件路径/filename.csv') 3. 使用head函数提取前十数据: first_ten_rows = data.head(10) 4. 根据要选择要显示的数据列,例如,如果有两列数据分别为'列1'和'列2',可以使用以下代码提取这两列数据: selected_columns = first_ten_rows[['列1', '列2']] 5. 绘制数据图形,例如,可以使用散点图表示两列数据的关系: plt.scatter(selected_columns['列1'], selected_columns['列2']) plt.xlabel('列1') plt.ylabel('列2') plt.title('前十数据散点图') plt.show() 以上代码提取CSV文件的前十数据,并绘制出选择的两列数据的散点图。 以上假定已将合适的文件路径和文件名替换到代码,请确保文件路径正确并包含正确的文件名。此外,还可以根据要调整代码的列名和图形绘制方式。 ### 回答3: 使用pandas提取csv文件的前十数据并绘制要完成以下步骤: 1. 导入必要的库:首先,我们要导入pandas和matplotlib库来处理数据和绘图。 ```python import pandas as pd import matplotlib.pyplot as plt ``` 2. 读取csv文件:使用pandas的`read_csv()`函数读取csv文件并存储为DataFrame对象。 ```python df = pd.read_csv('文件路径.csv') ``` 3. 提取前十数据:使用DataFrame对象的`head()`方法提取前十数据。 ```python top_10_data = df.head(10) ``` 4. 绘制数据:使用matplotlib库绘制所提取的前十数据。 ```python plt.plot(top_10_data['列名1'], top_10_data['列名2'], label='数据1') plt.plot(top_10_data['列名1'], top_10_data['列名3'], label='数据2') plt.xlabel('X轴标签') plt.ylabel('Y轴标签') plt.title('前十数据') plt.legend() plt.show() ``` 在以上代码,将`列名1`作为x轴数据,`列名2`和`列名3`作为y轴数据,可以根据实际情况修改。还可以根据要设置x轴和y轴的标签、图表标题等。最后,使用`plt.show()`方法显示绘图。 这样就能使用pandas提取csv文件前十数据并绘制出来。记得将代码的`'文件路径.csv'`、`'列名1'`、`'列名2'`和`'列名3'`替换为实际的文件路径和列名。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值