NLPIR文本分析工具的功能和特色介绍

NLPIR大数据语义智能分析平台提供包括精准采集、文档转化、新词发现等功能,适用于文本分析、情感分析、文档去重等任务。该平台支持全链条分析,提供客户端工具、云服务及二次开发接口,广泛应用于广告推荐、舆情监测等领域,服务了全球众多机构和高校。
摘要由CSDN通过智能技术生成

通常用于研究分析的数据中,非结构化的数据所占比例更高,这些非结构化的数据中也包含着重要的信息量,要运用文本分析工具来完成信息提取。文本分析是自然语言处理的一个小分支,是指从文本中抽取特征词进行量化以表示文本信息,文本一般指文字。过程是将无结构化的原始文本转化为结构化,高度抽象和特征化,计算机可以识别和处理的信息,进而利用机器学习,分类聚类等算法,再对文本进行分析处理。现已经在广告推荐和舆情监测方面实现应用。
在这里插入图片描述
NLPIR大数据语义智能分析平台十三大功能:
精准采集:对境内外互联网海量信息实时精准采集,有主题采集(按照信息需求的主题采集)与站点采集两种模式(给定网址列表的站内定点采集功能)。
文档转化:对doc、excel、pdf与ppt等多种主流文档格式,进行文本信息转化,效率达到大数据处理的要求。
新词发现:从文本中挖掘出新词、新概念,用户可以用于专业词典的编撰,还可以进一步编辑标注,导入分词词典中,提高分词系统的准确度,并适应新的语言变化。
批量分词:对原始语料进行分词,自动识别人名地名机构名等未登录词,新词标注以及词性标注。并可在分析过程中,导入用户定义的词典。
语言统计:针对切分标注结果,系统可以自动地进行一元词频统计、二元词语转移概率统计。针对常用的术语,会自动给出相应的英文解释。
文本聚类:能够从大规模数据中自动分析出热点事件,并提供事件话题的关键特征描述。同时适用于长文本和短信、微博等短文本的热点分析。
文本

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值