将问卷导出的Excel中多项选择的回答进行词频统计

本文链接：https://blog.csdn.net/m0_50868088/article/details/123447658

日常生活中面对的问卷，有询问对于某些产品的倾向（例如，喜欢哪种零食，薯片，可乐，薯条之类）可以多选的选项，虽然问卷导出数据时可以将各个选项的值，进行可视化展示，但是不能具体展示，单项（例如，喜欢薯条（只要选上薯条就可以））的人数。

下面将使用pandas将问卷导出的excel中，将单项数据进行统计，并将选项中所有被选的选项按照单项的形式，用列表输出，以及用字典形式展示，各个单项出现的频率，最终将统计的频率信息保存到excel中

#读取问卷内容
import pandas as pd
want=pd.read_excel(r'问卷导出的excel的路径')
#展示读取的问卷的前五行信息，差看是否，导入成功
print(want.head(5))


#得到pd内容的标题，对于问卷来说，一般是题目的标题
print(want.columns.values)


#第四列,直接统计单个词
#直接生成列表
#将列表中的数据进行统计
num_4=list(want['想要统计的列名称'])
dict_4={}
list_4=[]
str_0=''  
titleaa1='最终保存到Excel时想要的sheet的名称'
for i in num_4: 
    #print('i',i)
    a=len(i)
    for j in range(len(i)):
        #print('i[j]',i[j])
        #因为问卷中，多选时各个选项是按照'┋'进行隔开的
        if i[j] != '┋':
            st