《Python基础统计函数全面指南:mean(), round(), max(), min(), sum()的应用与实践》

一、引言

        Python中的基础统计函数在数据分析、科学计算和日常编程中扮演着至关重要的角色,这些函数能够高效地处理数据并提供关键的概览信息,为后续的数据分析和决策制定提供依据。它们常应用于数据清洗、性能监控、机器学习、金融分析、Web应用程序等等。总之,Python中的基础统计函数大大简化了数据处理流程,提高了数据洞察力,是现代编程、数据分析和科学研究中不可或缺的部分。

        下面通过实例来说明mean(), round(), max(), min(), sum()的应用,最后文后会给出其它统计函数的使用方法,以方便今后直接查询。

二、Python内置函数简介

1.mean()函数

        概述:mean()函数是用于计算一组数值平均值的关键统计函数。无论是Python内置的math模块还是更为强大的数据分析库numpypandas,都有提供该函数以支持各种数据类型的平均值计算。

1.1 numpy中的mean():
import numpy as np

# 创建一个numpy数组
data = np.array([1, 2, 3, 4, 5])

# 计算整个数组的平均值
average = np.mean(data)
print(average)

# 或者计算特定轴的平均值(例如,计算每列的平均值,对于二维数组)
data_2d = np.array([[1, 2, 3], [4, 5, 6]])
column_average = np.mean(data_2d, axis=0)#axis=0表示纵轴,结果应为2.5、3.5、4.5
print(column_average)

1.2 Pandas中的mean():
import pandas as pd

# 创建一个Series或DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})

# 计算整个DataFrame或某一列的平均值
df_mean = df.mean()
column_A_mean = df['A'].mean()
print(df_mean)
print(column_A_mean)

 2. round()函数

        四舍五入是python进行数据处理是的常用操作。

2.1. 对数字直接使用round():
# 四舍五入到默认的小数位数(即0位小数,相当于整数)
rounded_num = round(3.14159)
print(rounded_num)  # 输出: 3

# 自定义小数位数
rounded_num_two_decimal_places = round(3.14159, 2)
print(rounded_num_two_decimal_places)  # 输出: 3.14

# 对数组或列表中的每个元素进行四舍五入
numbers = [3.14159, 2.71828, 1.61803]
rounded_numbers = [round(num, 2) for num in numbers]
print(rounded_numbers)  # 输出: [3.14, 2.72, 1.62]

 2.2 在numpy中的round():
import pandas as pd

# 创建一个简单的DataFrame
df = pd.DataFrame({
    'Column1': [123.456789, 987.654321, 0.123456],
    'Column2': [0.987654, 0.456789, 0.123456],
    'Column3': [123456789.123456, 987654321.987654, 123456789.]
})

# 对DataFrame的数值列进行四舍五入操作,这里将数值四舍五入到两位小数
rounded_df = df.round(2)

print(rounded_df)

3. max()和min()函数

        max()和min()函数分别用于返回一组数值中的最大值和最小值,这些函数适用于各种类型的序列类型,包括单一数值、列表、元组以及numpy数组。

values = [3, 7, 1, 9, 4]
maximum_value = max(values)
minimum_value = min(values)
print(maximum_value)  # 输出:9
print(minimum_value)  # 输出:1

np_array = np.array([1.5, 2.7, 3.2, 1.8])
max_np = np.max(np_array)
min_np = np.min(np_array)
print(max_np)  # 输出:3.2
print(min_np)  # 输出:1.5

4.sum()函数 

numbers_list = [1, 2, 3, 4, 5]
total_sum = sum(numbers_list)
print(total_sum)  # 输出:15

numpy_array = np.array([1, 2, 3, 4, 5])
array_sum = np.sum(numpy_array)
print(array_sum)  # 输出:15

三、库中常见的基本函数

        Python中有许多基础统计函数,这里列出一些Python内置函数和NumPy、pandas库中常见的基础统计函数:

1.NumPy库中的统计函数:

  1. numpy.mean(a[, axis, dtype, out, keepdims]): 计算数组a的平均值(算术平均数)。

  2. numpy.median(a[, axis, out, overwrite_input, keepdims]): 计算数组a的中位数。

  3. numpy.std(a[, axis, ddof, keepdims]): 计算数组a的标准差。

  4. numpy.var(a[, axis, ddof, keepdims]): 计算数组a的方差。

  5. numpy.min(a[, axis, out, keepdims]): 计算数组a中元素的最小值。

  6. numpy.max(a[, axis, out, keepdims]): 计算数组a中元素的最大值。

  7. numpy.sum(a[, axis, dtype, out, keepdims]): 计算数组a中元素的总和。

2.Pandas库中的统计函数:

  1. pandas.Series.mean(): 计算Series的平均值。

  2. pandas.DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs): 计算DataFrame沿着指定轴的平均值。

  3. pandas.Series.min()pandas.DataFrame.min(): 计算最小值。

  4. pandas.Series.max()pandas.DataFrame.max(): 计算最大值。

  5. pandas.Series.sum()pandas.DataFrame.sum(): 计算总和。

        除了这些基础统计函数之外,还有其他的统计函数,如计算百分位数的numpy.percentile()、计算众数的numpy.nanmode()(考虑缺失值)、scipy.stats.mode()(不考虑缺失值)等。就不在这里展开了。

  • 25
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值