基于UGC的在线民宿满意度挖掘,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实现了在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能;构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型,最后选用贝叶斯模型进行情感分析,将情感分类概率分布作为情感趋势,最后通过POI热力图的方式对不同地域的民宿满意度进行展示。分析流程利用机器学习有监督标记样本进行分类,解决了因情感字典覆盖率不全造成分类精度低的问题。用户打分和评论不一致在满意度测评中影响比较大,使用自然语言处理技术能挖掘用户情感和需求,具体的打分和评论不一致现象如下。
一款基于在线名宿UGC数据的大数据意见挖掘决策软件
最新推荐文章于 2024-07-24 11:09:48 发布