情感倾向分析针对带有主观描述的中文文本,可自动判断该文本的情感极性类别并给出相应的置信度。情感类型分为积极、消极、中性。情感倾向分析能够帮助企业理解用户消费习惯、分析热点话题和危机舆情监控,为企业提供有力的决策支持。
上一次的介绍中我们讲解了情感分析的作用以及应用场景,技术难点以及百度Senta 系统对这些问题的解决方法以及核心技术。本次的介绍我们则侧重于实践,即利用百度深度学习框架PaddlePaddle Fluid, 实战Senta 系统。
Senta 是百度开源的情感分析(Sentiment Analysis) 系统,项目的github 地址是(https://github.com/baidu/Senta),Senta 也为百度AI 开放平台(http://ai.baidu.com/tech/nlp/sentiment_classify)提供了情感倾向分析模块,供用户直接使用。
此次我们将讲解如何本地构建Senta, 利用PaddlePaddle Fluid深度学习框架来实现情感分析模型的训练和部署。
实验环境准备:安装PaddlePaddle Fluid
运行本目录下的程序示例需要使用PaddlePaddle Fluid v1.1/1.2 版本。
使用pip 安装最新稳定版
# Linux CPU
pip install paddlepaddle
# Linux GPU cuda9cudnn7
pip install paddlepaddle-gpu
# Linux GPU cuda8cudnn7
pip install paddlepaddle-gpu==1.1.0.post87
# Linux GPU cuda8cudnn5
pip install paddlepaddle-gpu==1.1.0.post85
更详细的whl包列表也可以参见whl 包列表.
源码编译安装
如果需要安装最新的开发版,请按照安装文档中的说明更新PaddlePaddle Fluid 版本。
Senta 代码结构
Senta 项目的代码结构以及简介如下,本文重点介绍如何利用FluidPython API完成模型的构建和训练,关于如何利用Fluid C-API进行模型的在线部署,可以参考该项目的说明文档。