文字处理
petblue
这个作者很懒,什么都没留下…
展开
-
Java处理重复,重复的元素只保留一个。
一、第一个类。读取文字存储在LinkedList中,通过它的contains方法判断是否重复,重复不处理,不重复则加入。package com.aawant.nlp.filehandle;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.原创 2015-05-05 13:42:06 · 3468 阅读 · 0 评论 -
TFIDF算法,java代码实现
TFIDF算法,java代码实现TF-IDF算法全称为term frequency–inverse document frequency。TF就是term frequency的缩写,意为词频。IDF则是inverse document frequency的缩写,意为逆文档频率。 package com.aawant.nlp.featureExtraction.tfidf;import java.i原创 2015-05-05 16:09:32 · 7154 阅读 · 0 评论