调查问卷处理分析
语译分西
这个作者很懒,什么都没留下…
展开
-
问卷:批量处理问卷【单选题】X【策略人群】得出占比、频数、TGI
文章目录1. 导入数据,打印数据属性列表2. 获得单选题列表3.检查每一列是否都是int格式,不是的进行处理4.定义寻找非空值、非跳过的样本的函数5.主程序6.选择一个问卷问题的分析结果进行预览7.给选项重命名,并且将选项值只保留数字索引8.将选项从数字索引转换成实际的问卷选项字符串9.批量将每一题的分析结果导出到一个excel中的不同sheet1. 导入数据,打印数据属性列表import pandas as pdoriginal_data = pd.read_excel('19.新策略人群标注问卷数原创 2021-06-21 17:08:33 · 209 阅读 · 0 评论 -
问卷:策略人群划分
# 年龄18-24,购买力1/2/3def customer_seg(purchase,city,age,sex): # Z世代 if age == '18-24岁' and (purchase == 1 or purchase ==2 or purchase ==3): return 'Z世代' # 小镇百姓:25-44,购买力1,2;城市等级5,6 if (age == '25-29岁' or age == '30-34岁' or age ==原创 2021-06-19 15:21:23 · 1146 阅读 · 0 评论 -
问卷:问卷星【来源详情】ID,靠左补齐成8位数
data['来源详情'] = data['来源详情'].str.pad(width=8,side='left',fillchar='0')原创 2021-06-19 14:58:36 · 1604 阅读 · 0 评论 -
问卷:《问卷星》+《微调查》的【单选题】合并
问卷星和微调查两个调查问卷的题目略有不同,问卷星:单纯的是题目,微调查:会有题目题号和选项问卷星:“您的年龄是?”微调查:“3 -【第1题-单选题】 您的年龄是?(1)18岁以下(2)18-24岁(3)25-29岁(4)30-34岁(5)35-39岁(6)40-44岁(7)45-49岁(8)50-54岁(9)55-59岁(10)60岁及以上”所以要统一题目名称才能进行合并1.找出问卷星里的单选题,然后写成列表2.筛选出微调查的单选列表,检查顺序、数量是否跟问卷星的一样3.原创 2021-06-19 14:53:30 · 1105 阅读 · 0 评论 -
问卷:筛选出【微调查】问卷数据中的【单选题】
import pandas as pddata = pd.read_excel('微调查.xlsx')col_list = data.columns.to_list() #提取问卷的属性名称列表danxuan_list = []# 找出属性名中包含“单选题”字样的属性for i in col_list: if '单选题' in i: danxuan_list.append(i.strip())...原创 2021-06-19 13:48:01 · 194 阅读 · 0 评论 -
问卷:问卷星文本导出数据的多选题,排序题的处理拆分
问卷星问卷如果选择的是文本导出而非序号导出,多选题和排序题会用 | 分割符号隔开各个选项以后应该不会用文本导出的数据了,用序号数据首先要找出要处理的选择题的选项有哪些然后判断选项是否出现multi_question_list = ['实用派','自在派','佛系一族','精打细算族','奋斗族']def find_option(x,option): if option in x: return option else: return ''原创 2021-06-19 12:46:00 · 5791 阅读 · 0 评论 -
问卷:单选题的选项转换成1,2,3,4...数值
dict0 = {'新房': 4, '现住房': 3, '出租房(我是房东)': 2, '出租房(我是租客)':1 } dict1 = {'2000元以下':0,'2000-3999元':1,'4000-5999元':2,'6000-7999元':3,'xxxx':4,}dict2 = {'未婚,与父母同住':1,'单身/情侣同居':2,'已婚,两口之家':3,'二胎家庭':4,'三代同堂':5,'一家三口':6}df2['购买场景'] = df2['购买场景'].map(dict0)df2[原创 2021-06-19 12:06:28 · 1468 阅读 · 0 评论 -
问卷:城市名 转换成 城市线:一线、新一线、二三四五线
文章目录导入数据遇到问题1:列名太长,要替换遇到问题2:区名称、城市名混乱遇到问题3:去空格制作{城市:城市线} 字典,然后匹配统计问卷总体样本的城市线分布找出没有标注上城市线的样本,查看原因导入数据import pandas as pdcity = pd.read_excel('!202006中国城市商业魅力排行榜完整排名排名(337城市)-第一财经.xlsx')# 读取问卷数据data = pd.read_excel('微调查40899_readable (1492).xlsx')dat原创 2021-06-19 11:57:26 · 927 阅读 · 0 评论
分享