pandas - DataFrame 基础计算（求和、平均值、最大值、最小值、中位数、众数、方差、标准差、分位数）

嗖100

已于 2023-07-06 23:31:55 修改

阅读量5.6k

点赞数 3

分类专栏： python 文章标签： pandas python 机器学习

于 2023-07-06 23:02:32 首次发布

本文链接：https://blog.csdn.net/weixin_42115865/article/details/131586865

版权

python 专栏收录该内容

19 篇文章

订阅专栏

文章展示了如何使用PandasDataFrame进行基本的统计计算，包括行和列的求和、平均值、最大值、最小值、中位数、众数、方差、标准差以及分位数。同时，还介绍了如何执行shift偏移计算来获取数据序列的差分值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

pandas - DataFrame

1、 DataFrame计算


def genericCalFun():
    """
    DataFrame计算
    :return:
    """
    data = [
        [1, 1, 1, 1],
        [2, 1, 2, 1],
        [3, 1, 3, 1],
        [4, 1, 4, 1],
        [5, 1, 5, 1]
    ]
    columns = ['col-1', 'col-2', 'col-3', 'col-4']
    index = ['idx-1', 'idx-2', 'idx-3', 'idx-4', 'idx-5']

    df = pd.DataFrame(data=data, index=index, columns=columns)

    # 行求和
    row_sum = df.sum(axis=1)

    # 列求和
    row_col = df.sum(axis=0)

    # 平均值
    mean = df.mean()

    # 最大值
    max = df.max()

    # 最小
    min = df.min()

    # 中位数
    median = df.median()

    # 众数
    mode = df.mode()

    # 方差
    var = df.var(axis=1)

    # 标准差
    std = df.std(axis=1)

    # 分位数也称分位点，它以概率为依据将数据分割为几个等份（中位数（即二分位数）、四分位数）
    quantile = df.quantile(0.35)

原始数据

	       col-1  col-2  col-3  col-4
	idx-1      1      1      1      1
	idx-2      2      1      2      1
	idx-3      3      1      3      1
	idx-4      4      1      4      1
	idx-5      5      1      5      1

row_sum 行求和返回结果：

	idx-1     4
	idx-2     6
	idx-3     8
	idx-4    10
	idx-5    12
	dtype: int64

row_col 列求和返回结果：

	col-1    15
	col-2     5
	col-3    15
	col-4     5
	dtype: int64

mean 平均值返回结果：

	col-1    3.0
	col-2    1.0
	col-3    3.0
	col-4    1.0
	dtype: float64

max 最大值返回结果：

	col-1    5
	col-2    1
	col-3    5
	col-4    1
	dtype: int64

min 最小值返回结果：

	col-1    1
	col-2    1
	col-3    1
	col-4    1
	dtype: int64

median 中位数返回结果：

	col-1    3.0
	col-2    1.0
	col-3    3.0
	col-4    1.0
	dtype: float64

mode 众数返回结果：

	   col-1  col-2  col-3  col-4
	0      1    1.0      1    1.0
	1      2    NaN      2    NaN
	2      3    NaN      3    NaN
	3      4    NaN      4    NaN
	4      5    NaN      5    NaN

var 方差返回结果：

	idx-1    0.000000
	idx-2    0.333333
	idx-3    1.333333
	idx-4    3.000000
	idx-5    5.333333
	dtype: float64

std 标准差返回结果：

	idx-1    0.000000
	idx-2    0.577350
	idx-3    1.154701
	idx-4    1.732051
	idx-5    2.309401
	dtype: float64

quantile 分位数返回结果：

	col-1    2.4
	col-2    1.0
	col-3    2.4
	col-4    1.0
	Name: 0.35, dtype: float64

2、 shift偏移计算


def diffFun():
    """
    shift偏移计算
    :return:
    """
    data = [
        [10, 12],
        [12, 22],
        [17, 32],
        [15, 42],
        [20, 52]
    ]
    columns = ['col-1', 'col-2']
    index = ['idx-1', 'idx-2', 'idx-3', 'idx-4', 'idx-5']

    df = pd.DataFrame(data=data, index=index, columns=columns)

    df['差分'] = df['col-1'] - df['col-1'].shift()
    print(df)

col-1 利用 shift偏移计算

	       col-1  col-2   差分
	idx-1     10     12  NaN
	idx-2     12     22  2.0
	idx-3     17     32  5.0
	idx-4     15     42 -2.0
	idx-5     20     52  5.0