自然语言处理
文章平均质量分 56
2017不平凡的一年
这个作者很懒,什么都没留下…
展开
-
自然语言处理基于java实现(4) 之 基于VSM模型的信息检索程序
一. 题目如下: 依据实验3建立的索引文件,实现一个基于VSM模型的信息检索程序。解释下,如何实现一个基于VSM模型的信息检索程序? // 段落序号,词条, tf-idf值 的二维空间表 private final Table<Integer,String,Double> vectorTable = HashBasedTable.create()原创 2017-04-06 00:26:11 · 2499 阅读 · 0 评论 -
自然语言处理基于java实现(3) 之 信息检索
一. 题目如下 1、在小文档集合(199801.txt)中建立一个索引文件:每一行是一条term,每个term后面跟着一个索引记录表,包括:文档频率、文档序号(对文档序号进行排序);整个索引对term进行排序。 考虑:Term如何定义? 2、基于上述小文档集(199801.txt) ,建立一个位置索引文件。199801.txt文档集截图: 索引文件结果效果如下图: 索引文件表结构:原创 2017-04-06 00:05:30 · 3083 阅读 · 0 评论 -
自然语言处理基于java实现(1) 之 中文分词
下一篇<自然语言处理基于java实现(2) 之 词性注释> 程序源码下载 一. 题目如下: 1、针对人民日报语料,编写程序: 抽取词表 统计总词数、不同的词及其次数。输出文件格式: 第一行是语料库中的总词数,之后每行一个词及其次数,按照词频从小到大排序。如: 总词数:10000 #韩国:169原创 2017-04-05 19:57:27 · 11368 阅读 · 5 评论