pandas 数据分析相关性_Python数据分析基础之Pandas（七）简单数据分析

最新推荐文章于 2024-06-29 16:17:32 发布

王文璐

最新推荐文章于 2024-06-29 16:17:32 发布

阅读量809

点赞数

文章标签： pandas 数据分析相关性

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42523104/article/details/114906516

版权

本文介绍了如何使用Pandas进行数据分析，涵盖基本统计分析如计数、求和、平均值，分组分析，分布分析，交叉分析（透视表），结构分析和相关性分析。通过实例展示了如何进行相关性判断，并提供了相关代码示例。

摘要由CSDN通过智能技术生成

这节介绍如何使用pandas做简单的数据分析,内容包括基本统计分析、分组分析、分布分析、交叉分析(透视表)、结构分析和相关性分析

以下实例数据文件,可以从该站内链接获取

1.基本统计分析

一般统计某变量的最大最小值，中值，分位值，中位数，众数，均值等

size 计数

sum() 求合

mean() 均值

var() 方差

std() 标准差

mode() 众数

median() 中位数

2.分组分析

根据分组字段将分析对象划分为不同部分，以对比分析各组之间差异性的一种分析方法

说白了就是：计数，求合，平均值

df.groupby(by=['分类1','分类2',...])[被统计的列].agg({列名1:统计函数1,列名2:函数2,...})

import pandas as pd

import numpy as np

df1 = pd.read_csv("../material/i_nuc_sheet7.csv")

df1 = df1.iloc[:,1:]

print(df1.head())

print(df1.describe())

group = df1.groupby(['班级']) #第一参就是by参数

print(group['军训','英语','体育',"性别"].mean()) #性别不是数值，会被忽略

print(df1.groupby(['班级',"性别"])['军训','英语','体育',"性别"].mean()) #先对班分组，再对性别分组

#如果对科目获取不同的统计量，要用到agg()

res = df1.groupby(by=['班级','性别'])['军训',"英语"].agg({

"总分":np.sum,

"人数":np.size,

"均值":np.mean,

"方差":np.var,

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。