pandas中apply()+value_counts()使用方法

hooyying

已于 2022-03-31 23:03:24 修改

阅读量1.9k

点赞数

分类专栏：数据分析文章标签： python pandas

于 2022-03-26 00:45:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hooyying/article/details/123747781

版权

数据分析专栏收录该内容

43 篇文章 6 订阅

订阅专栏

df = pd.DataFrame(np.arange(12).reshape((4,3)),\
                  columns=list('abe'),\
                  index = ['wo','shi','shui','ha'])

formatr = lambda x:'%.1f' %x
df.apply(formatr)

pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame，功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数

运行上面的代码会出错

TypeError: cannot convert the series to <class ‘float’>

不能向Dataframe.apply()中传递不能处理数组的函数

下面这个可以

formatr = lambda x:'%.1f' %x
df.applymap(formatr)

formatr = lambda x:'%.1f' %x
df['b'].map(formatr)

二。使用apply()+value_counts()对DataFrame查询不重复值

data = pd.DataFrame({'qu1':[1,3,4,3,4],
                    'qu2':[2,6,1,7,3],
                     'qu3':[1,5,2,4,4]})
data

   qu1 	qu2 qu3
0 	1 	2 	1
1 	3 	6 	5
2 	4 	1 	2
3 	3 	7 	4
4 	4 	3 	4

一共7个不重复值

data.value_counts()这种写法并不正确，它返回每一行不重复的次数

{(1, 2, 1): 1, (3, 6, 5): 1, (3, 7, 4): 1, (4, 1, 2): 1, (4, 3, 4): 1}

qu1  qu2  qu3
1    2    1      1
3    6    5      1
     7    4      1
4    1    2      1
     3    4      1
dtype: int64

我们要对逐个值进行分析，所以要使用apply函数

data.apply(pd.value_counts)

     qu1 	qu2 	qu3
1 	1.0 	1.0 	1.0
2 	NaN 	1.0 	1.0
3 	2.0 	1.0 	NaN
4 	2.0 	NaN 	2.0
5 	NaN 	NaN 	1.0
6 	NaN 	1.0 	NaN
7 	NaN 	1.0 	NaN

形成一个以不重复值为索引，形成对每一列计算不重复次数为值的新DataFrame

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas中apply()+value_counts()使用方法

df = pd.DataFrame(np.arange(12).reshape((4,3)),\ columns=list('abe'),\ index = ['wo','shi','shui','ha'])formatr = lambda x:'%.1f' %xdf.apply(formatr)pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame，功能也是自动遍历整个 Series 或
复制链接

扫一扫

专栏目录

hooyying CSDN认证博客专家 CSDN认证企业博客

码龄18年

50: 原创

8万+: 周排名

35万+: 总排名

20万+: 访问

: 等级

1006: 积分

16: 粉丝

51: 获赞

8: 评论

232: 收藏

私信

关注

热门文章

分类专栏

数据分析 43篇
游戏 1篇
路由器 2篇
linux 4篇
编辑器 5篇
浏览器插件 1篇

最新评论

pandas使用cut分割区间继而用groupby对数据分组
記憶~: 我也遇到了和你类似的问题，用了sum以后感觉是对行数划分后求的和，你解决这个问题了吗
pandas使用cut分割区间继而用groupby对数据分组
零点存在定理: 作者大大，你知道如何进行数据分割区间后再算出他的总和吗？就是对价格进行分割区间后，对每个价格区间的销售量进行求和
pandas利用日期作为索引再使用groupby聚合
weixin_42182654: 设置index的时候，增加drop=True，应该是之前dataframe的index是自动生成的数据，现在要把日期变成索引
dataframe普通切片与loc，iloc选取数据
qq_42638786: 写的很好，成功解决了我的疑惑！
pandas利用日期作为索引再使用groupby聚合
汨莜: 您好，我的程序会提示'Int64Index' object has no attribute 'to_period'，请问有解决方式吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。