Pandas数据统计函数

最新推荐文章于 2024-05-24 21:19:07 发布

我在燕京有把刀

最新推荐文章于 2024-05-24 21:19:07 发布

阅读量122

点赞数

分类专栏： Python 数据分析文章标签： python pandas 数据分析

本文链接：https://blog.csdn.net/qq_42672132/article/details/120720358

版权

Python 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

数据分析

2 篇文章 0 订阅

订阅专栏

Pandas数据统计函数

汇总类统计函数
唯一去重和按值计数
相关系数和协方差

学习自：https://www.bilibili.com/video/BV1UJ411A7Fs?p=6

0、数据准备

import pandas as pd
fpath = "../datas/beijing_tianqi/beijing_tianqi_2018.csv"
df = pd.read_csv(fpath)


# 显示前三行数据
df.head(3)

# 字符串处理
# 字符串替换并改变数据类型
df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')
df.loc[:, "yWendu"] = df["yWendu"].str.replace("℃", "").astype('int32')

1、汇总类统计

# 一次提取所有数字列统计结果
df.describe()

在这里插入图片描述

# 获取bWendu这个series的平均值
df[:,"bWendu"].mean()

# 
df[:,"bWendu"].max()

#
df[:,"bWendu"].min()

2、唯一去重和按值计数（字符串计数）

唯一性去重

# 将该列的所有内容去重后列举出来，
df["fengxiang"].unique()
['东北风' '北风' '西北风' '西南风' '南风' '东南风' '东风' '西风']


# 按值计数  会统计所有字符串出现的次数
df["tianqi"].value_counts()

3、相关系数和协方差

协方差：衡量同向反向程度，如果协方差为正，说明X，Y同向变化，协方差越大说明同向程度越高；如果协方差为负，说明X，Y反向运动，协方差越小说明反向程度越高。
相关系数：衡量相似度程度，当他们的相关系数为1时，说明两个变量变化时的正向相似度最大，当相关系数为－1时，说明两个变量变化的反向相似度最大

3.1、：

# 协方差矩阵
df.cov()

# 相关系数矩阵
df.corr()
# 查看空气质量和最高温度的相关系数
df.["aqi"].corr(df["bWendu"])

我在燕京有把刀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas数据统计函数

Pandas数据统计函数汇总类统计函数唯一去重和按值计数相关系数和协方差0、数据准备import pandas as pdfpath = "../datas/beijing_tianqi/beijing_tianqi_2018.csv"df = pd.read_csv(fpath)# 显示前三行数据df.head(3)# 字符串处理# 字符串替换并改变数据类型df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").as
复制链接

扫一扫

专栏目录