【中文情感分析】SO-PMI算法(HarvestText库的修正以及解析)

简述

在最近的RA过程中,需要使用一个库,同时对其的原理需要理解。然后就研究了一些,发现了几个有趣的,其中一个HarvestText中文情感分析。

  • 我研究了他的源码后,再结合理论知识发现了这个库在情感分析上的一个很重要的问题。并提交了代码,完成了合并。下面是我的fork后的库
  • https://github.com/Sean16SYSU/HarvestText

在这里插入图片描述

SO-PMI算法

  • 输入:文章集合。pos词汇集和neg词汇集(不需要给分数)
  • 输出:未知词汇的分数

PMI

  • PMI,Pointwise Mutual Information, 即点互信息, log ⁡ 2 P ( A , B ) P ( A ) P ( B ) \log_2\frac{P(A, B)}{P(A)P(B)} log
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

gc.collect()

公众号“肥宅Sean”欢迎关注

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值