基于词典方法和机基于器学习方法的中文情感倾向分析

基于词典方法和机基于器学习方法的中文情感倾向分析

项目简介

文本情感分析又称意见挖掘, 是对包含用户观点、 喜好、 情感等主观性文本进行挖掘、 分析及判别它是一个多学科交叉的研究领域, 涉及概率论、 数据统计分析、 计算机语言学、 自然语言处理、 机器学习、 信息检索、 本体学 ( Ontology) 等多个学科及其相关技术 。
目前, 情感分类大致涌现出两种研究思路:基于情感知识和基于特征。前者主要是基于已有的情感词典或情感知识库 对文本中带有情感或极性的词( 或词语单元) 进行加权求和,而后者主要是对文本提取具有类别表征意义的 特征, 再基于这些特征使用机器学习算法进行分类。
本项目运用情感词典与机器学习两种方法分别进行文本情感分析,并提供结果对比。

项目构建方法

环境准备

  • Windows/MacOS/Linux
  • Python3.6
  • PyCharm or other IDEs

导入项目

Open the file named"Chinese-emotion-anlysis" with IDE

项目运行方法

本地运行

cd [project folder]
python3 manager.py runserver [port]

直接访问

http://115.28.245.233:8080

项目基本功能

机器学习方法的接口,接受一个中文文本, 可得到一个正向情感极性的概率和负向情感
的概率。

基于情感词典的方法的接口, 输入一段中文文本, 可得到文本的情感极性分值 。

可对 篇章级、段落级、句子级 的中文文本进行情感极性判断。

基于情感词典的方法的接口,可以使用不同的情感词典对中文文本进行情感分析。

基于机器学习的方法的接口,可以导入一个训练好的模型来对中文文本进行情感分析。

分析算法以及修复程序中的bug。

代码结构说明

Chinese_Emotion_Anakysis

settings.py web的总配置文件

url.py web的路由配置

Emotion_Manager

CEA_LIB NLP分析库

pkl_data 处理之后的数据

raw_data 未处理之前的数据

chinese_emotion_analysis.py NLP方法的接口

classifier.pkl 训练好的分类器模型

Modules 词典方法分析库

res字典存放处

main.py 接口

migrations 数据连接层

static 静态资源文件

templates 网页模板

models.py 模型构建

views.py web逻辑

  • 12
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值