pandas 库基于 NumPy,自然也可以用这些函数对数据框进行描述性统计。
pandas 还提供了更加便利的方法来计算均值 ,如 detail[‘amounts’].mean()
pandas 还提供了一个方法叫作 describe,能够一次性得出数据框所有数值型特征的非空 值数目、均值、四分位数、标准差。detail[[‘counts’,‘amounts’]].describe()
描述类别型特征的分布状况,可以使用频数统计表。pandas 库中实现频数统计的方法为 value_counts。
pandas 提供了 categories 类,可以使用 astype 方法将目标特征的数据类型转换为 category 类别。
describe 方法除了支持传统数值型以外,还能够支持对 category 类型的数据进行描述性 统计,四个统计量分别为列非空元素的数目,类别的数目,数目最多的类别,数目最多类别的数目。
pandas 统计分析 描述DataFram数据
最新推荐文章于 2024-07-28 18:07:04 发布