python 数据挖掘在线_在线民宿 UGC 数据挖掘实战

本课程使用TensorFlow 2.3、scikit-learn等工具,对民宿用户评论进行数据挖掘和情感分析。通过LBS接口扩展数据,应用K-Means、LDA进行主题建模,并用Flask部署情感分析模型。课程涵盖数据预处理、模型训练、部署和可视化,适合想要提升数据挖掘技能的学习者。
摘要由CSDN通过智能技术生成

TensorFlow 是一个基于 Python 的开源机器学习库,很多互联网的大厂在进行深度学习时,都会使用该框架。课程利用最新的 TensorFlow 2.3、scikit-learn、LDAvis 和 Flask 等对民宿用户评论进行挖掘和情感推理模型部署。

首先,利用百度 LBS 平台的 POI 接口对民宿地址的批量解析,扩展民宿数据维度。然后,构建了词向量 K-Means 和 LDA 无监督主题聚类模型,自动利用主题中心词能找出对应的主题属性字典;最后,以用户打分作为标注,搭建情感分析模型,分析在不同评价主题下的民宿顾客满意度。

利用时下流行的 Python 建模工具深入挖掘用户评论中的评价主题和情感极性,解决了用户打分和评论不一致的问题。本次实战课程贯穿数据预处理、模型训练、模型部署、批量预测和结果可视化,帮助大家由浅入深的理解和操作数据挖掘,本实验随处可见的模型参数注释更适合爱学习的你去调试最优的模型参数,让你在实战中掌握当下的最热门人工智能开发和使用技巧。

此次课程内容可以大致将分为以下五个部分:

基于 Pandas 和 pyecharts 的数据聚合和可视化分析。

主题建模实战,包括:词频排序模型下的主题词云分析、基于 Word2Vec 词向量下的 KMeans 名词聚类、LDA 主题建模。

针对数据集标签失衡问题,实验分析了不用数据采样方式对情感分析模型性能的影响。

介绍了基于 Stacking 的集成模型和深度情感分析模型在用户评论情感建模上的性能差异,然后针对深度模型分别使用字符级和词语级进行建模来比较差异,深度模型具体有 TextCNN 和 GRU。

主要实现模型的部署,使用 Flask 框架对 litNlp 深度情感分析模型进行 RESTfu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值