pandas是做数据分析时的最常用的库。
因为需要到处某列数据的类别数量,解决方法如下:
path = r'需要录入excel数据的完整路径'
#读取excel文件
data = pd.read_excel(path,names=None,sheet_name='Sheet1',index_col=None,header=None)
#重命名dataframe的列名,方便后续处理和访问
data.columns = ['data','ID','name','gender','age','position','Acquisition','registration','x','y','z','comment']#重命名列名方便后续
#data.info() #获取dataframe信息
#获取某列数据类别
df_group = data.groupby(['position']) #要获取每个类别数量.count()
#print(df_group.groups.keys())
#.groups字典属性
key_list = list(df_group.groups.keys()) #把获取类别转为列表
count_list = data['position'].value_counts().tolist() #把各个数据类别的数量转为列表
#data.groupby(['position']).count()
#输出类别列表
print(cata_list)
#输出类别数量列表
print(count_list)