文本摘要与关键词提取

灵玖软件:www.lingjoin.com


大数据论坛:www.bigdatabbs.com





文章关键词提取中间件能够在全面把握文章的中心思想的基础上,提取出若干个代表文章语义内容的词汇或短语,相关结果可用于精化阅读、语义查询和快速匹配等。



  采用基于语义的统计语言模型,所处理的文档不受行业领域限制,且能够识别出最新出现的新词语,所输出的词语可以配以权重。



  文章关键词提取组件的主要特色在于:



  1、速度快:可以处理海量规模的网络文本数据,平均每小时处理至少50万篇文档;



  2、处理精准:Top N的分析结果往往能反映出该篇文章的主干特征;


  3、精准排序:关键词按照影响权重排序,可以输出权重值;



  4、开放式接口:文章关键词提取组件作为LJParser的一部分,采用灵活的开发接口,可以方便地融入到用户的业务系统中,可以支持各种操作系统,各类调用语言。





转载于:https://my.oschina.net/u/944980/blog/131270

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值