版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/sinat_38893241/article/details/80414977
在《pandas数据框,统计某列数据与其他文件对应关系的个数》之后,我发觉简单版的元素个数统计问题没有说清楚,就在这里介绍两个统计pandas数据框里面列、行元素个数的方法:
代码如下:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.zeros((8,4)))#新建一个数据框
df.iloc[2:6,0]=1#将第0列的第3行到第6行的值改为1
def getlistnum(li):#这个函数就是要对列表的每个元素进行计数
li = list(li)
set1 = set(li)
dict1 = {}
for item in set1:
dict1.update({item:li.count(item)})
return dict1
zero_col_count = getlistnum(df[0])#df[0]指列名为0的列,如果你的列名是字符串就要加引号
three_row_count = getlistnum(df.loc[3])#df.loc[0]指行名为0的行,同样字符串的话要加引号
新建数据框并改值
统计得到结果
当然,我们可以用pandas库自带的统计值函数,这样效率更高,代码如下:
zero_col_count = dict(df[0].value_counts())#统计第0列元素的值的个数
three_row_count = dict(df.loc[3].value_counts())#统计第3行元素的值的个数
————————————————
版权声明:本文为CSDN博主「CommaDou」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/sinat_38893241/article/details/80414977