data_pd.value_counts()和data_pd.groupby(by='类别').goups

最新推荐文章于 2023-11-03 00:53:00 发布

wnloverforever

最新推荐文章于 2023-11-03 00:53:00 发布

阅读量302

点赞数

分类专栏： pandas

本文链接：https://blog.csdn.net/wnloverforever/article/details/105203928

版权

pandas 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

data = [['青年', '否', '否', '一般', '否']
, ['青年', '否', '否', '好', '否']
, ['青年', '是', '否', '好', '是']
, ['青年', '是', '是', '一般', '是']
, ['青年', '否', '否', '一般', '否']
, ['中年', '否', '否', '一般', '否']
, ['中年', '否', '否', '好', '否']
, ['中年', '是', '是', '好', '是']
, ['中年', '否', '是', '非常好', '是']
, ['中年', '否', '是', '非常好', '是']
, ['老年', '否', '是', '非常好', '是']
, ['老年', '否', '是', '好', '是']
, ['老年', '是', '否', '好', '是']
, ['老年', '是', '否', '非常好', '是']
, ['老年', '否', '否', '一般', '否']]
data_pd = pd.DataFrame(data, columns=['年龄', '有工作', '有自己的房子', '信贷情况', '类别'])

data_pd.head(3)

	年龄	有工作	有自己的房子	信贷情况	类别
0	青年	否	否	一般	否
1	青年	否	否	好	否
2	青年	是	否	好	是

data_pd['年龄'].value_counts()

老年    5
中年    5
青年    5
Name: 年龄, dtype: int64

data_pd.groupby(by='类别').groups

{'否': Int64Index([0, 1, 4, 5, 6, 14], dtype='int64'),
 '是': Int64Index([2, 3, 7, 8, 9, 10, 11, 12, 13], dtype='int64')}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wnloverforever

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

利用Python分析航空公司客户价值

IT之旅的博客

01-11

8763

利用Python分析航空公司客户价值一、背景介绍随着社会生活中数据量的急剧增多，如何从这些海量的数据中提取与发掘出对我们决策有用的信息成为当前亟待解决的题，因此，数据分析与挖掘技术在这些年得到了广泛的发展，也受到了足够的重视。面对不同领域的数...

pd.pivot_table 、sort_values()，value_counts()

weixin_49928588的博客

07-06

1197

数据分析工具

参与评论您还未登录，请先登录后发表或查看评论

python：pandas数值统计，.value_counts()的用法，全DataFrame数据计数

养乐多的博客

04-12

2万+

value_counts() 计数参数名作用sort=True是否要进行排序（默认：进行排序）（默认：降序排列）是否要对计算结果进行标准化，并且显示标准化后的结果（默认：False）bins=None可以自定义分组区间（默认：否）是否删除缺失值nan（默认：删除）

.value_counts()跟.groupby()的区别

最新发布

整理做过的题目，不然就要忘记了！

11-03

239

value_counts()是一种用于计算Series中每个唯一值出现次数的函数1。例如，如果你有一个Series s，其中包含以下值。在Pandas中，.value_counts()和.groupby()都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。这将返回一个GroupBy对象，你可以使用它来对数据进行聚合操作。都是用于对数据进行聚合的函数，但它们的使用方式和结果略有不同。分组的平均值为-0.102949和-0.032087，而。分组的平均值为-0.155270和0.045764。

使用data.value_counts()方法对Series数组中的重复元素进行统计

weixin_41855010的博客

02-10

4266

类似于excel中的分类汇总，pandas库中为Series类的数据提供了.value_counts()方法，使用这种方法就可以完成重复元素的统计工作，这个方法将返回一个新的Series数组，这个数组的index是重复元素的内容（即原来数组中出现过的值），values中则存放着这个内容出现的次数。我们可以使用以下代码来进行演示： import pandas as pd import random ...

python数据分析性能提升之避免使用pd.Series的value_counts()

S_o_l_o_n的博客

09-27

2134

在数据分析时，当我们需要统计一个数据集中的元素的出现次数时，对于pandas中的Series对象，直接有value_counts函数，会直接返回一个以元素为索引，出现次数为值的Series，如下图所示。问题在于，如果数据集较大，而且其中的元素也不是int或者float等简单的对象，例如是列表、元组等对象，那么利用Series的value_counts对象是非常低...

【Pandas】pandas.Series.value_counts的使用

Loewi的博客

04-09

2588

语法： Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)[source] Return a Series containing counts of unique values. The resulting object will be in descending ord...

python频数统计value_counts和groupby方法

红泥小火炉的博客

03-29

1万+

python频数统计和groupby方法频数统计groupby方法频数统计先用字典类型的数据创建一个DataFrame，test_data import pandas as pd test_data = pd.DataFrame({ 'x1': ["a", "b", "c", "b"], "x2": [1, 2, 3, 4], "x3": [4, 3, 2, 1] })...

pandas 数据统计groupby/value_counts

shineLikeTheSun的博客

10-10

1604

显示概况单个 df[['age','grade']].median() #计算age grade每一列的中位数当然前提是他们要为数值型数据总体 df[['age','grade']].describe() #计算min,max,std,median...当然只会显示类型是数字列的信息自定义（如果你嫌弃descrbe()给出的值太多） df[['age','grade']].agg({ 'age':['min','max'] 'grad

python中分组频率统计功能_python频数统计value_counts和groupby方法

weixin_39986435的博客

02-03

2389

python频数统计和groupby方法频数统计先用字典类型的数据创建一个DataFrame，test_dataimport pandas as pdtest_data = pd.DataFrame({'x1': ["a", "b", "c", "b"],"x2": [1, 2, 3, 4],"x3": [4, 3, 2, 1]})test_data显示结果????显示效果实在是太丑了，做笔记就这么看吧...

python中的value_counts()的用法

qq_42665335的博客

07-24

3万+

value_counts()是一种查看表格某列中有多少个不同值的快捷方法，并计算每个不同值有在该列中有多少重复值。 1、value_counts()在Series的用法 import pandas as pd import numpy as np from pandas import DataFrame from pandas import Series s1=Series(["timo",...

value_counts计算DataFrame,Series的数据频率

热门推荐

鱼霸

01-09

3万+

在pandas里面常用用value_counts确认数据出现的频率。 Series 情况下 import numpy as np import pandas as pd from pandas import DataFrame from pandas import Series ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'To

dataframe iloc_pd.DataFrame的基本操作

weixin_39869959的博客

11-22

1595

1. 转置.T方法import 2. 查看DataFrame头部数据, 尾部数据.head()方法, 查看Series头部(前几个)数据..tail()方法, 查看Series尾部(后几个)数据.import 3. DataFrame数据索引 [超级重要]3.0 查看索引.columns方法, 查看列标签. .index方法, 查看行标签.import 3.1 标签索引按标签, 索引列, df[列...

dataframe 筛选_创建pd.DataFrame的方法. pd.DataFrame函数详解

weixin_39789792的博客

11-24

1367

DataFrame是由多种类型的列构成的二维标签数据结构.[1]往往包含index(行标签)和columns(列标签), 彼此独立, 互不影响直观理解:DataFrame 是带标签的二维数组1.由(元组),[列表]或一维数组构成的(元组)或[列表]创建(元组)和[列表]在这里用法几乎相同, 下面用[列表]代表1.1[[列表]列表]或[(元组)列表]或([列表]元组)或((元组)元组)import...

【机器学习】决策树代码练习

fengdu78的博客

12-04

1757

本课程是中国大学慕课《机器学习》的“决策树”章节的课后代码。课程地址：https://www.icourse163.org/course/WZU-1464096179课程完整代码：http...

机器学习-决策树理论

wendaocp的博客

03-21

354

决策树理论本文先从熵说起，再到互信息，到信息增益。借助信息增益来确定决策树某节点的最优特征选择。使用递归的思想将决策树构建出来。当树构建完成后，在使用此树做预测时，依然使用递归的思路。所需基础熵数据结构-树递归算法熵决策树理论中始终离不开熵的身影。图1 熵图1中展示了各种熵H，由此韦恩图可知： I(X;Y) = H(X) - H(X|Y) // 其中I(X;Y) 被称为互...

pandas这几个函数比excel的数据透视表还要好用！！

youzi85的博客

02-01

763

还有一点crosstab优于pivot_table的地方，分别查看这两个函数，pivot_table是将数据用data传入，所以基本就是一张表中的数据。excel的数据透视表，就可以把一个维度的数据变成两个维度的数据，如下图显示，一个维度的数据，表示数据的增加只能向下添加。而两个维度的数据，即可以向下添加数据，还可以往右添加数据。时间是index列，除去index列，所有的数据都要从进行列变行的转变，所以id_vars不赋值，value_vars将各列名字传入，然后保留索引，就能得到想要的结果。

PYTHON_分组（groupby，value_counts)

penny1218的博客

10-27

1626

#1.全部数据集 data.groupby('col1').count() #单列分组 data.groupby(['col1','col2']).mean() #多列分组 #筛选部分列 data.groupby('col1')['col2','col3'].count() data[['col1','col2','col3']].groupby(by=['col3']).count() data['col1'].groupby(data['col2']).size() #3.多种聚合 data.gro

python处理数据 value_counts频数 groupby分类汇总 merge匹配

qq_42871249的博客

10-24

3680

问题描述：df表是学生的刷卡记录数据，df1表是学生的各个课程的绩点数据，现在要计算每个学生的刷卡频数以及其对应的平均绩点。解决：先用value_counts计算df表的频数，再用groupby计算每个学生的平均绩点，最后再用merge函数连接。 value_counts()计算频数 value_counts是对计算频数的函数需要注意，value_counts生成的结果索引是sfrzh，值是...

number_of_crimes = data_train.Category.value_counts()

05-30

`data_train`是指训练数据集，`.Category`表示选取数据集中的“犯罪类型”这一列，`value_counts()`是一个函数，可以统计每个犯罪类型出现的次数。最终结果会以一个Series对象的形式返回，并存储在`number_of_crimes...