中文文章情感分析-开源工具分享

最近研究了一阵子中文情感分析的一些paper,很感兴趣,于是最终决定写一个中文情感分析的工具。作为开源思想的忠实粉丝,我也献丑一次,把自己拙劣的代码呈现给大家,欢迎大家拍板砖。希望这个工具能给大家带来一些实际的用处。

目前,这个工具只实现了使用一种基本算法来预测文章的情感。经过本人测试,基本满足对中文句子的情感倾向分析,而且准确度可以信赖。大家如果有这个需求,想简单分析一下某个汉语评论集合的情感倾向,可以直接把这个工具拿去使用。

下面是这个工具的性能和准确度量化指标:

性能:      每秒处理约10万汉字

准确度:   约90%


本人会长期维护这个工具,并会逐步添加更多的预测算法,增加更多算法的选择。

Bitbucket库地址:https://bitbucket.org/shichaoqu/semantic-analysis-tool/overview

工具提供的功能:

1. 基于python-jieba中文分词包,对文章和句子进行分词;

2. 使用大连理工大学情感分析词库,对文章分词结果进行词语的情感预测;

3. 使用bsa_agorithm作为基本情感分析算法,基于词语的情感预测来聚合整个文章的情感倾向和情感强度。


TODO list:

1. 扩展情感词典,未来会添加hownet和ntsu情感词词库的支持,并添加响应的情感词定位接口;

2. 扩展情感分析算法,支持更多常见算法的选择,提供更精确的情感分析算法;

3. 情感信息抽取,提取观点持有者,主语和情感陈述,以及他们之间的关系。


评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值