微博舆情之特定话题情感分析

最新推荐文章于 2024-01-21 14:21:09 发布

Claire_Bear7

最新推荐文章于 2024-01-21 14:21:09 发布

阅读量6.2k

点赞数 6

分类专栏：项目总结文章标签：微博

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/claire7/article/details/46701591

版权

本文介绍了微博情感分析的过程，主要包括文本预处理、情感信息提取和情感极性判断。使用了哈工大的LTP进行预处理，通过同义词词林和情感词库判断词的极性，并结合VSI进行调整，最后计算句子极性。

摘要由CSDN通过智能技术生成

本文介绍一下在做微博特定话题情感分析中的做法，核心就是判断文本的情感极性，再根据这个极性来进行情感判定。

主要经过了以下几个步骤：

文本预处理
- 去乱码、去网络词
- 利用LTP获取分词、句子结构及成分等信息
情感信息提取
- 在同义词词林里面找单词编码
情感极性判断
- 在情感基准库里面寻找单词极性
- 用VSI 进行调整
- 用VBS分析主题词极性
- 计算句子极性

下面就按照这三部分分别介绍：

文本预处理

文本预处理中主要用了语言技术平台（Language Technology Platform，LTP），它是哈工大社会计算与信息检索研究中心历时十年研制的一整套开放中文自然语言处理系统。 LTP制定了基于XML的语言处理结果表示，并在此基础上提供了一整套自底向上的丰富、高效、高精度的中文自然语言处理模块。主要包含以下9个模块：
这里写图片描述

分句
分词：分词是基于字的序列标注问题，对于输入句子的字序列，模型给句子的每个字标注一个标识词边界的标记。
词性标注(Part-of-speech, POS)：词性标注是给每个词一个词性类别（名词、动词、形容词等）的任务。
命名实体识别(Named Entity Recognition, NER)：是在句子的词序列中定位并识别人名

最低0.47元/天解锁文章

关注

6
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。