07-17 分组聚合--基本的统计方法

最新推荐文章于 2023-12-10 19:49:01 发布

withxinxin

最新推荐文章于 2023-12-10 19:49:01 发布

阅读量559

点赞数

分类专栏：练习题知识要点

本文链接：https://blog.csdn.net/weixin_46400833/article/details/107412925

版权

本文介绍了Python数据分析中的分组聚合操作，包括如何按特定列进行数据转换、选取需要的列、计算统计指标（如均值、最值），以及使用aggregate、apply和transform函数进行复杂的数据处理。通过对字符型变量的统计和分类汇总，展示了如何进行样本数量统计和自定义函数计算。

摘要由CSDN通过智能技术生成

分组聚合–主要有以下知识点：

1、描述性统计知识 ，如min() 最小值，max() 最大值，median() --中位数，mead() 均值，

quantitle 分位数，quantitle（0.1,0,2,0.5,0.8）分别表示 十分位数，二十分位数，

五十分位数--又叫中位数，八十分位数等

2、分组运算方法--groupby ，类似于SQL中的groupby方法

3、聚合方法--egg,apply和transfrom等

实例如下：

os.chdir('数据存储路径')
sales=pd.read_csv('app.csv',dtype=['year':float])

—将year这一列下的数据读取成浮点型数据
选取想要的列名（因为数据很多很多时我们选取想要的变量）

import pandas as pd
import numpy as np
import os

list=[['2000','89','24','34','78','LOL','900'],
      ['2001','44','34','343','34','LOL','487'],
      ['2008','22','333','34','66','CS','868'],
     ['2010','322','434','342','676','CS','988'],
     ['2018','356','445','666','777','VB','777']]

list
[[‘2000’, ‘89’, ‘24’, ‘34’, ‘78’, ‘LOL’, ‘900’],
[‘2001’, ‘44’, ‘34’, ‘343’, ‘34’, ‘LOL’, ‘487’],
[‘2008’, ‘22’, ‘333’, ‘34’, ‘66’, ‘CS’, ‘868’],
[‘2010’, ‘322’, ‘434’, ‘342’, ‘676’, ‘CS’, ‘988’],
[‘2018’, ‘356’, ‘445’, ‘666’, ‘777’, ‘VB’, ‘777’]]

os.chdir('C:\data')
sales=pd.DataFrame(list,columns=['year', 'n_sale', 's_sale',
 'china_sale', 'e_sale', 'name', 'money'])

sales

year	n_sale	s_sale	china_sale	e_sale	name	money
0	2000	89	24	34	78

最低0.47元/天解锁文章

withxinxin

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
07-17 分组聚合--基本的统计方法

分组聚合–主要有以下知识点：1、描述性统计知识，如min() 最小值，max() 最大值，median() --中位数，mead() 均值，quantitle 分位数，quantitle（0.1,0,2,0.5,0.8）分别表示十分位数，二十分位数，五十分位数--又叫中位数，八十分位数等2、分组运算方法--groupby ，类似于SQL中的groupby方法3、聚合方法--egg,apply和transfrom等实例如下：os.chdir('数据存储路径')sales=pd.r
复制链接

扫一扫