《Python基础统计函数全面指南：mean(), round(), max(), min(), sum()的应用与实践》

最新推荐文章于 2024-07-26 17:36:26 发布

锂享生活

最新推荐文章于 2024-07-26 17:36:26 发布

阅读量1.9k

点赞数 26

分类专栏： python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/m0_63227758/article/details/137947635

版权

python 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

一、引言

Python中的基础统计函数在数据分析、科学计算和日常编程中扮演着至关重要的角色，这些函数能够高效地处理数据并提供关键的概览信息，为后续的数据分析和决策制定提供依据。它们常应用于数据清洗、性能监控、机器学习、金融分析、Web应用程序等等。总之，Python中的基础统计函数大大简化了数据处理流程，提高了数据洞察力，是现代编程、数据分析和科学研究中不可或缺的部分。

下面通过实例来说明mean(), round(), max(), min(), sum()的应用，最后文后会给出其它统计函数的使用方法，以方便今后直接查询。

二、Python内置函数简介

1.mean()函数

概述：mean()函数是用于计算一组数值平均值的关键统计函数。无论是Python内置的math模块还是更为强大的数据分析库numpy和pandas，都有提供该函数以支持各种数据类型的平均值计算。

1.1 numpy中的mean():

import numpy as np

# 创建一个numpy数组
data = np.array([1, 2, 3, 4, 5])

# 计算整个数组的平均值
average = np.mean(data)
print(average)

# 或者计算特定轴的平均值（例如，计算每列的平均值，对于二维数组）
data_2d = np.array([[1, 2, 3], [4, 5, 6]])
column_average = np.mean(data_2d, axis=0)#axis=0表示纵轴，结果应为2.5、3.5、4.5
print(column_average)

1.2 Pandas中的mean():

import pandas as pd

# 创建一个Series或DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})

# 计算整个DataFrame或某一列的平均值
df_mean = df.mean()
column_A_mean = df['A'].mean()
print(df_mean)
print(column_A_mean)

2. round()函数

四舍五入是python进行数据处理是的常用操作。

2.1. 对数字直接使用round():

# 四舍五入到默认的小数位数（即0位小数，相当于整数）
rounded_num = round(3.14159)
print(rounded_num)  # 输出: 3

# 自定义小数位数
rounded_num_two_decimal_places = round(3.14159, 2)
print(rounded_num_two_decimal_places)  # 输出: 3.14

# 对数组或列表中的每个元素进行四舍五入
numbers = [3.14159, 2.71828, 1.61803]
rounded_numbers = [round(num, 2) for num in numbers]
print(rounded_numbers)  # 输出: [3.14, 2.72, 1.62]

2.2 在numpy中的round():

import pandas as pd

# 创建一个简单的DataFrame
df = pd.DataFrame({
    'Column1': [123.456789, 987.654321, 0.123456],
    'Column2': [0.987654, 0.456789, 0.123456],
    'Column3': [123456789.123456, 987654321.987654, 123456789.]
})

# 对DataFrame的数值列进行四舍五入操作，这里将数值四舍五入到两位小数
rounded_df = df.round(2)

print(rounded_df)

3. max()和min()函数

max()和min()函数分别用于返回一组数值中的最大值和最小值，这些函数适用于各种类型的序列类型，包括单一数值、列表、元组以及numpy数组。

values = [3, 7, 1, 9, 4]
maximum_value = max(values)
minimum_value = min(values)
print(maximum_value)  # 输出：9
print(minimum_value)  # 输出：1

np_array = np.array([1.5, 2.7, 3.2, 1.8])
max_np = np.max(np_array)
min_np = np.min(np_array)
print(max_np)  # 输出：3.2
print(min_np)  # 输出：1.5

4.sum()函数

numbers_list = [1, 2, 3, 4, 5]
total_sum = sum(numbers_list)
print(total_sum)  # 输出：15

numpy_array = np.array([1, 2, 3, 4, 5])
array_sum = np.sum(numpy_array)
print(array_sum)  # 输出：15

三、库中常见的基本函数

Python中有许多基础统计函数，这里列出一些Python内置函数和NumPy、pandas库中常见的基础统计函数：

1.NumPy库中的统计函数：

numpy.mean(a[, axis, dtype, out, keepdims]): 计算数组a的平均值（算术平均数）。
numpy.median(a[, axis, out, overwrite_input, keepdims]): 计算数组a的中位数。
numpy.std(a[, axis, ddof, keepdims]): 计算数组a的标准差。
numpy.var(a[, axis, ddof, keepdims]): 计算数组a的方差。
numpy.min(a[, axis, out, keepdims]): 计算数组a中元素的最小值。
numpy.max(a[, axis, out, keepdims]): 计算数组a中元素的最大值。
numpy.sum(a[, axis, dtype, out, keepdims]): 计算数组a中元素的总和。

2.Pandas库中的统计函数：

pandas.Series.mean(): 计算Series的平均值。
pandas.DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs): 计算DataFrame沿着指定轴的平均值。
pandas.Series.min(), pandas.DataFrame.min(): 计算最小值。
pandas.Series.max(), pandas.DataFrame.max(): 计算最大值。
pandas.Series.sum(), pandas.DataFrame.sum(): 计算总和。

除了这些基础统计函数之外，还有其他的统计函数，如计算百分位数的numpy.percentile()、计算众数的numpy.nanmode()（考虑缺失值）、scipy.stats.mode()（不考虑缺失值）等。就不在这里展开了。

锂享生活

关注

26
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
《Python基础统计函数全面指南：mean(), round(), max(), min(), sum()的应用与实践》

在python进行数据分析时，常需要对数据进行求平均、中位数、求最大值、最小值等操作，本文通过实例简要介绍常见的统计函数的用法。
复制链接

扫一扫

专栏目录