常用的舆情监测技术分享

在当下,舆情监测已被广泛应用于各领域,从企业到党政机关、高校,再到公众人物,相关事业单位等。
因此市场上相关的舆情监测软件产品也是层出不穷,可供用户选择。
从技术角度来看,网络舆情监测其实是众多技术结合的成果。一般来说,舆情监测技术手段主要包括:

一、网络舆情采集
在信息采集步骤中,主要包括网络爬虫(We-bCrawler)和网页清洗(WebPageCleaning)等技术。
网络爬虫是一个按照一定规则自动抓取网络信息的程序,又称为网络蜘蛛(WebSpider)。网络爬虫分为三类:通用爬虫(GeneralPurposeWebCrawler) ,面向主题爬虫(FocusCrawlerorTopicalCrawler) ,面向DeepWeb爬虫(DeepWebCrawler)。考虑到网络舆情监测一般是面向行业监测,倾向于使用面向主题爬虫。
网页清洗就是从网页中过滤掉“噪声"数据,提取出网页中有价值的信息内容。网页清洗分析方法主要分为三类:基于树结构分析方法,基于Web挖掘方法,基于正则表达式方法。基于树结构分析方法应用最广,开源软件Htmlparse是比较有代表性的工具,缺点是高度依赖每个网站网页的结构。

二、舆情自动分类
网络舆情分类是将收集的舆情进行自动分类,是整理和发现舆情的关键步骤,主要运用到自然语言处理中的文本分类(TextCategorization)和文本聚类(TextClusters)等技术。

三、话题识别与跟踪
话题识别与跟踪(TopicDetectionandTracking)是对网络舆情聚类分析后,通过算法找出热点问题,并通过算法跟踪话题发展过程,是网络舆情监测中的核心技术。

四、文本情感分析
文本情感分析(又称文本倾向性或意见挖掘(OpinionMining)),是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分析是自然语言处理技术中新兴的研究课题,具有很大的研究价值和应用价值,一般来说,它分为三个主要研究任务:情感信息抽取、情感信息分类、情感信息的检索与归纳。
识微科技舆情监测服务

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值