python输出不重复的单词_Python情感分析(比较单词时,不计算文本中重复的单词)...

您可以使用嵌套的for loop来实现这一点,但是这并不是解决简单问题的好方法:for posWord in posWords:

for test in readFile:

if i == test:

counter +=1

print i

print(counter)

这并不是分析情绪的有效方法,相反,你只是在检查文本中是否存在一个没有上下文的积极词,而这并不能告诉你太多信息。你处理这个任务的方式忽略了日常语言中常见的语义,比如双否定、回文等等。而且,看起来你并没有从文本中过滤出停止词或词干词。见Stemming Algorithms。在

情绪分析应该是统计学的产物。基于结构化的方法并不像语义实现那样有用——然而,这是一个有待讨论的问题(可能)。此外,一种监督学习方法[binary or multiclass]将文本分类为预定义的类别,如肯定或否定。情绪分析的一个典型方法是实现naivebayes框架,尽管已经提出了更有效/更强大的方法(SVM、隐马尔可夫模型等)。见参考资料2。在

虽然我并不真正从事情感分析,除非我想让我的生活更轻松,或者赞美我已经在做的事情,但我确实研究了自然语言处理中的几个主题。我坚信,学术领域已经远远超过了商业领域的努力,事实上,一些公司正在产生的结果/结论/价格是歇斯底里的-我仍然会遇到一个体面的实施。如果你想了解更多关于这个领域的知识,我建议你阅读发表在IEEE&ACM上的学术期刊。在

值得注意的资源:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值