日常生活中面对的问卷,有询问对于某些产品的倾向(例如,喜欢哪种零食,薯片,可乐,薯条之类)可以多选的选项,虽然问卷导出数据时可以将各个选项的值,进行可视化展示,但是不能具体展示,单项(例如,喜欢薯条(只要选上薯条就可以))的人数。
下面将使用pandas将问卷导出的excel中,将单项数据进行统计,并将选项中所有被选的选项按照单项的形式,用列表输出,以及用字典形式展示,各个单项出现的频率,最终将统计的频率信息保存到excel中
#读取问卷内容
import pandas as pd
want=pd.read_excel(r'问卷导出的excel的路径')
#展示读取的问卷的前五行信息,差看是否,导入成功
print(want.head(5))
#得到pd内容的标题,对于问卷来说,一般是题目的标题
print(want.columns.values)
#第四列,直接统计单个词
#直接生成列表
#将列表中的数据进行统计
num_4=list(want['想要统计的列名称'])
dict_4={}
list_4=[]
str_0=''
titleaa1='最终保存到Excel时想要的sheet的名称'
for i in num_4:
#print('i',i)
a=len(i)
for j in range(len(i)):
#print('i[j]',i[j])
#因为问卷中,多选时各个选项是按照'┋'进行隔开的
if i[j] != '┋':
st