前几天,公司的几个华科的实习生他们做文本挖掘的项目,说啥Word2vec啥的,好像是做文本分析、分词啥的吧。
今天无意间在网上发现了这个好东西:语意分析系统,可以快速对文本进行分析。


简介
NLPIR是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR分词系统前身为2000年发布的ICTCLAS词法分析系统,从2009年开始,为了和以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,调整命名为NLPIR分词系统。NLPIR 系统支持多种编码(GBK 编码、UTF8 编码、BIG5 编码)、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统)、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等)。
NLPIR工程包简介
License--一个月的授权文件;如果发生授权过期的情况,可以在此目录下下载更新。NLPIR_Demo--组件功能演示demo(NLPIR大数据搜索与挖掘共享开发平台

NLPIR是一个强大的文本分析系统,支持多种编码和操作系统,适用于各种开发语言。它提供分词、新词发现、统计分析等功能,适用于大数据搜索、挖掘、分类过滤、自动摘要和关键词提取等任务。
最低0.47元/天 解锁文章

590

被折叠的 条评论
为什么被折叠?



