Pandas 数据统计函数
- 汇总类统计
"""
df.describe()返回:
count:数量统计,此列共有多少有效值
std:标准差
min:最小值
25%:四分之一分位数
50%:二分之一分位数
75%:四分之三分位数
max:最大值
mean:均值"""
df_describe = df.describe(include=None) # all时所有列都会输出,None输出只会包含all numeric columns.
# print(df_describe)
df_count = df["pv"].count() # 有效元素的个数
df_mean = df["uv"].mean() # 平均值
df_max = df["uv"].max() # 最大值
df_min = df["pv"].min() # 最小值
# print(df_count, df_mean, df_max, df_min)
- 唯一性去重
uq = pd.unique(df["姓名"]) # 根据哈希表返回唯一值
# print(uq)
- 按值计数
vc = df["pv"].value_counts()
vc2 = df["姓名"].value_counts()
# print(vc)
# print(vc2)