python pandas 常用函数（三）各种列变形（统计列元素数量,index转列）

最新推荐文章于 2023-05-20 10:51:02 发布

君克

最新推荐文章于 2023-05-20 10:51:02 发布

阅读量1.4k

点赞数

分类专栏： pandas 文章标签： python 大数据机器学习

本文链接：https://blog.csdn.net/mushixiyou/article/details/106135874

版权

pandas 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

统计每列元素数量

#统计某列每个元素出现的次数，返回字典，{'该列元素':数量,}
one_count = dict(df['待统计列名'].value_counts)

参数详解

normalize : boolean, default False　如果设置为true，则以百分比的形式显示
sort : boolean, default True　是否排序
ascending : boolean, default False　默认降序排序
bins : integer, optional 而不是数值计算，把它们分成半开放的箱子，一个方便的pd.cut，只适用于数字数据
dropna : boolean, default True　默认删除na值

pandas index转列（.reset_index函数）

常见如下嵌套字典类型的数据结构，可转为dataframe，外层字典的键作为列名，内层字典的键作为行索引，同时进行df的相关操作。

tmp_dict = {'aa':[11,12,13],'bb':[66,67,68]}
result = {}
result['creative_id'] = tmp_dict
df = pd.DataFrame(result)
print(df)
print(df.reset_index('user_id'))#以index作为一列，列名为“index”

此时的“index”是不能进行rename操作的，若需操作，可复制该列到新的列中再rename。

pandas Series

Series是类似于一维数组的对象，常见的list及dict都可以转为Series。

#字典转Series
#键为行索引
tmp_dict = {'aa':[11,12,13],'bb':[66,67,68]}
result = Series(tmp_dict)
print(result)

君克

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python pandas 常用函数（三）各种列变形（统计列元素数量,index转列）

统计每列元素数量#统计某列每个元素出现的次数，返回字典，{'该列元素':数量,}one_count = df['待统计列名'].value_counts参数详解normalize : boolean, default False　如果设置为true，则以百分比的形式显示sort : boolean, default True　是否排序ascending : boolean, default False　默认降序排序bins : integer, optional 而不是数值计算，把它们分成半
复制链接

扫一扫