TensorFlow 是一个基于 Python 的开源机器学习库,很多互联网的大厂在进行深度学习时,都会使用该框架。课程利用最新的 TensorFlow 2.3、scikit-learn、LDAvis 和 Flask 等对民宿用户评论进行挖掘和情感推理模型部署。
首先,利用百度 LBS 平台的 POI 接口对民宿地址的批量解析,扩展民宿数据维度。然后,构建了词向量 K-Means 和 LDA 无监督主题聚类模型,自动利用主题中心词能找出对应的主题属性字典;最后,以用户打分作为标注,搭建情感分析模型,分析在不同评价主题下的民宿顾客满意度。
利用时下流行的 Python 建模工具深入挖掘用户评论中的评价主题和情感极性,解决了用户打分和评论不一致的问题。本次实战课程贯穿数据预处理、模型训练、模型部署、批量预测和结果可视化,帮助大家由浅入深的理解和操作数据挖掘,本实验随处可见的模型参数注释更适合爱学习的你去调试最优的模型参数,让你在实战中掌握当下的最热门人工智能开发和使用技巧。
此次课程内容可以大致将分为以下五个部分:
基于 Pandas 和 pyecharts 的数据聚合和可视化分析。
主题建模实战,包括:词频排序模型下的主题词云分析、基于 Word2Vec 词向量下的 KMeans 名词聚类、LDA 主题建模。
针对数据集标签失衡问题,实验分析了不用数据采样方式对情感分析模型性能的影响。
介绍了基于 Stacking 的集成模型和深度情感分析模型在用户评论情感建模上的性能差异,然后针对深度模型分别使用字符级和词语级进行建模来比较差异,深度模型具体有 TextCNN 和 GRU。
主要实现模型的部署,使用 Flask 框架对 litNlp 深度情感分析模型进行 RESTfu