统计每列元素数量
#统计某列每个元素出现的次数,返回字典,{'该列元素':数量,}
one_count = dict(df['待统计列名'].value_counts)
参数详解
normalize : boolean, default False 如果设置为true,则以百分比的形式显示
sort : boolean, default True 是否排序
ascending : boolean, default False 默认降序排序
bins : integer, optional 而不是数值计算,把它们分成半开放的箱子,一个方便的pd.cut,只适用于数字数据
dropna : boolean, default True 默认删除na值
pandas index转列(.reset_index函数)
常见如下嵌套字典类型的数据结构,可转为dataframe,外层字典的键作为列名,内层字典的键作为行索引,同时进行df的相关操作。
tmp_dict = {'aa':[11,12,13],'bb':[66,67,68]}
result = {}
result['creative_id'] = tmp_dict
df = pd.DataFrame(result)
print(df)
print(df.reset_index('user_id'))#以index作为一列,列名为“index”
此时的“index”是不能进行rename操作的,若需操作,可复制该列到新的列中再rename。
pandas Series
Series是类似于一维数组的对象,常见的list及dict都可以转为Series。
#字典转Series
#键为行索引
tmp_dict = {'aa':[11,12,13],'bb':[66,67,68]}
result = Series(tmp_dict)
print(result)