python输出不重复的单词_Python情感分析（比较单词时，不计算文本中重复的单词）...

weixin_39942451

于 2020-12-05 18:58:44 发布

阅读量282

点赞数

文章标签： python输出不重复的单词

您可以使用嵌套的for loop来实现这一点，但是这并不是解决简单问题的好方法：for posWord in posWords:

for test in readFile:

if i == test:

counter +=1

print i

print(counter)

这并不是分析情绪的有效方法，相反，你只是在检查文本中是否存在一个没有上下文的积极词，而这并不能告诉你太多信息。你处理这个任务的方式忽略了日常语言中常见的语义，比如双否定、回文等等。而且，看起来你并没有从文本中过滤出停止词或词干词。见Stemming Algorithms。在

情绪分析应该是统计学的产物。基于结构化的方法并不像语义实现那样有用——然而，这是一个有待讨论的问题(可能)。此外，一种监督学习方法[binary or multiclass]将文本分类为预定义的类别，如肯定或否定。情绪分析的一个典型方法是实现naivebayes框架，尽管已经提出了更有效/更强大的方法(SVM、隐马尔可夫模型等)。见参考资料2。在

虽然我并不真正从事情感分析，除非我想让我的生活更轻松，或者赞美我已经在做的事情，但我确实研究了自然语言处理中的几个主题。我坚信，学术领域已经远远超过了商业领域的努力，事实上，一些公司正在产生的结果/结论/价格是歇斯底里的-我仍然会遇到一个体面的实施。如果你想了解更多关于这个领域的知识，我建议你阅读发表在IEEE&amp；ACM上的学术期刊。在

值得注意的资源：

weixin_39942451

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。