python 处理表格petl高端库

自动化测试分享

于 2024-05-09 22:14:30 发布

阅读量710

点赞数 16

分类专栏：功能测试软件测试程序员文章标签： python 开发语言程序员职场经验测试工具自动化测试笔记

本文链接：https://blog.csdn.net/2301_76387166/article/details/138634107

版权

软件测试同时被 3 个专栏收录

339 篇文章 3 订阅

订阅专栏

功能测试

247 篇文章 0 订阅

订阅专栏

程序员

183 篇文章 0 订阅

订阅专栏

petl 是一个 Python 库，全称 "Python ETL"（Extract, Transform, Load 的缩写），用于轻松地进行数据处理任务。它设计的目的是为了让数据的提取、转换和加载过程变得简单直观，类似于使用电子表格。petl 提供了一套丰富的函数集来操作表格数据，无论是从 CSV 文件、Excel 文件、数据库还是其他数据源中读取数据，都可以方便地进行筛选、排序、合并、转换等操作，并能将结果输出到不同的格式。

安装 petl

首先，你需要安装 petl。可以通过 pip 来安装：

pip install petl

基本使用示例

下面是一些基本的 petl 使用示例：

1. 加载数据

从 CSV 文件加载数据：

from petl import fromcsv
table = fromcsv('example.csv')

2. 查看数据

查看表格的前几行：

from petl import head
head(table, 5)  # 显示前5行数据

3. 筛选数据

筛选出某一列符合条件的行：

from petl import selectwhere
filtered_table = selectwhere(table, 'age', '>', 30)  # 筛选年龄大于30的行

4. 排序数据

按某一列排序：

from petl import sort
sorted_table = sort(table, 'age')  # 按年龄升序排序
sorted_table_desc = sort(table, 'age', reverse=True)  # 按年龄降序排序

5. 转换/映射列值

修改或转换某一列的值：

from petl import convert
converted_table = convert(table, 'age', lambda v: v + 1)  # 将年龄增加1

6. 输出数据

将处理后的数据输出到新的 CSV 文件：

分组聚合

假设我们有一个表格 sales_data，其中包含产品销售记录，有两列分别为 'product' 和 'amount'。

from petl import aggregate
# 假设 sales_data 已经定义
grouped_data = aggregate(sales_data, keys=['product'], aggregates={'amount': 'sum'})

# 这会按 'product' 列分组，并计算每组 'amount' 的总和

连接表格

如果有两个表格 orders 和 products，分别存储订单信息和产品信息，可以通过共同列（比如 'product_id'）来连接它们。

from petl import join
# 假设 orders 和 products 已经定义，并且两者都有 'product_id' 列
joined_table = join(orders, products, key='product_id')

去重

去除表格中的重复行，假设我们的表格名为 data_with_duplicates

from petl import distinct
unique_data = distinct(data_with_duplicates)

统计分析

进行基本的统计分析，比如计算某一列的平均值、最大值、最小值等。

from petl import stats
# 假设我们有一个表格 numbers 包含一列数值数据
mean_value = stats.mean(numbers, 'value')  # 计算 'value' 列的平均值
max_value = stats.max(numbers, 'value')    # 计算 'value' 列的最大值
min_value = stats.min(numbers, 'value')    # 计算 'value' 列的最小值

行动吧，在路上总比一直观望的要好，未来的你肯定会感谢现在拼搏的自己！如果想学习提升找不到资料，没人答疑解惑时，请及时加入群： 759968159，里面有各种测试开发资料和技术可以一起交流哦。

最后： 下方这份完整的软件测试视频教程已经整理上传完成，需要的朋友们可以自行领取【保证100%免费】

软件测试面试文档

我们学习必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有字节大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

在这里插入图片描述

自动化测试分享

关注

16
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
python 处理表格petl高端库

petl 是一个 Python 库，全称 "Python ETL"（Extract, Transform, Load 的缩写），用于轻松地进行数据处理任务。它设计的目的是为了让数据的提取、转换和加载过程变得简单直观，类似于使用电子表格。petl 提供了一套丰富的函数集来操作表格数据，无论是从 CSV 文件、Excel 文件、数据库还是其他数据源中读取数据，都可以方便地进行筛选、排序、合并、转换等操作，并能将结果输出到不同的格式。
复制链接

扫一扫

专栏目录