最近接触到一些调查问卷和分析调查问题的项目。 这里谈一下调查问卷里的语义分析, 以及如何用python 来做语义分析。
知识地图:
涉及到的文本分析方法: 词频分析, 关键词提取, 词云图, 情感分析, 主题模型;
会用到的库: python sklearn, python jieba, python wordcloud;
需求:
一共有1500来条数据, 分析不同行业会计人群对会计行业培训的需求及职业展望。
图表样式:
分析思路:(1)对不同行业不同职业目标进行用户心智雷达图的绘制(2)对五年内提升怎么样的能力方面做词频分析条形图.(3)对职业提升方式做了词频统计和条形图(4)对你喜欢向哪些老师学习做词频分析和条形图 (6)所在单位对会计人才培养采取哪些方式(词频分析,条形图)(5)会计人才能力培养变化+(7)所在单位人才培养特色和效果 情感分析+ 关键词提取+ 情感分析分布图+ 词云图+ 正面评论的百分比+ 饼图正负面评论分布+ 负面评论词云图+ 加负面评论排名前十的词
这里重点挑(1), (2), (5)或(7)道, 展示代码和画图过程:
(1) 问题. 3-5年内您的职业发展目标包括那些? 1-5 分
注; 标注很乱, 但是要到原表中改名字太麻烦, 所以就意思意思了。
(2)对五年内提升怎么样的能力方面做词频分析条形图.
思路: 具体操作如下, 从全表中导出q11 的9行, 单独成表, 命名为test.txt. 之后再把表格的格式转变了 UTF-8, 生成新的表格test2.txt, 之后