【Pandas】深入解析pandas中的统计汇总函数`min()`

云天徽上

于 2024-06-11 20:22:42 发布

阅读量241

点赞数 6

分类专栏： Pandas 文章标签： pandas python numpy 机器学习深度学习

本文链接：https://blog.csdn.net/qq_38614074/article/details/139607947

版权

Pandas 专栏收录该内容

78 篇文章 0 订阅

订阅专栏

【Pandas】深入解析min()函数
在这里插入图片描述

在数据分析的世界里，Pandas库无疑是一个强大的工具，它提供了丰富的函数来处理和操作数据。其中，min()函数是一个非常重要的聚合函数，用于找出数据中的最小值。本文将深入解析Pandas中的min()函数，并通过源代码和案例来展示其用法和特性。

一、min()函数简介

Pandas中的min()函数是一个用于计算DataFrame或Series对象中最小值的方法。它可以沿着指定的轴（axis）进行计算，并返回最小值的Series或Scalar值。

二、min()函数的用法

对Series使用min()

对于Series对象，min()函数将返回该Series中的最小值。

import pandas as pd

# 创建一个Series对象
s = pd.Series([1, 2, 3, 4, 5])

# 使用min()函数找出最小值
min_value = s.min()
print(f"最小值为: {min_value}")

对DataFrame使用min()

对于DataFrame对象，min()函数默认沿着列（axis=0）进行计算，返回每一列的最小值。

# 创建一个DataFrame对象
df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [10, 20, 30, 40, 50]
})

# 使用min()函数找出每一列的最小值
min_values = df.min()
print(f"每一列的最小值为:\n{min_values}")

如果想要沿着行（axis=1）计算最小值，可以通过设置axis参数来实现。

# 使用min()函数找出每一行的最小值
min_values_per_row = df.min(axis=1)
print(f"每一行的最小值为:\n{min_values_per_row}")

跳过缺失值

min()函数默认会跳过NaN值（即缺失值），只计算非NaN值的最小值。

# 创建一个包含NaN值的Series对象
s_with_nan = pd.Series([1, 2, np.nan, 4, 5])

# 使用min()函数找出最小值（会跳过NaN值）
min_value_with_nan = s_with_nan.min()
print(f"最小值为（忽略NaN）: {min_value_with_nan}")

三、高级用法和案例

在条件筛选后的数据上使用min()

我们可以先使用布尔索引或条件表达式对数据进行筛选，然后再对筛选后的数据使用min()函数。

# 找出A列大于2的行中，B列的最小值
min_b_value = df[df['A'] > 2]['B'].min()
print(f"A列大于2的行中，B列的最小值为: {min_b_value}")

使用apply()函数结合min()

apply()函数可以沿着DataFrame的轴应用一个函数。结合min()函数，我们可以实现更复杂的操作。

# 假设我们想要找出每一行中除了第一列之外的最小值
min_values_except_first_col = df.iloc[:, 1:].apply(min, axis=1)
print(f"除了第一列之外，每一行的最小值为:\n{min_values_except_first_col}")

四、总结

Pandas的min()函数是一个功能强大的工具，它可以帮助我们快速找出数据中的最小值。通过本文的介绍，我们了解了min()函数的基本用法、高级用法以及一些实际案例。希望这些内容能够帮助您更好地使用Pandas进行数据分析。

云天徽上

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Pandas】深入解析pandas中的统计汇总函数`min()`

函数是一个用于计算DataFrame或Series对象中最小值的方法。它可以沿着指定的轴（axis）进行计算，并返回最小值的Series或Scalar值。在数据分析的世界里，Pandas库无疑是一个强大的工具，它提供了丰富的函数来处理和操作数据。函数是一个功能强大的工具，它可以帮助我们快速找出数据中的最小值。函数是一个非常重要的聚合函数，用于找出数据中的最小值。函数默认会跳过NaN值（即缺失值），只计算非NaN值的最小值。函数默认沿着列（axis=0）进行计算，返回每一列的最小值。对于Series对象，
复制链接

扫一扫