- 博客(3)
- 资源 (1)
- 收藏
- 关注
lucene分词分析器Analyzer
SimpleAnalyzer StandardAnalyzer WhitespaceAnalyzer StopAnalyzer 测试代码: import java.io.Reader; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis...
2007-06-20 19:27:00 66
nutch输出文件的读取
Nutch的输出文件(不包括临时文件)主要可分为crawldb、index、indexs、linkdb和segments。Crawldb<o:p></o:p> Crawldb是所有需要抓取的超连接信息Segments<o:p></o:p>Segments是每轮抓取的时候根据crawldb生成的。存放的信息包括6种content、crawl...
2007-01-03 18:40:00 105
WORD保存问题
WORD的时候老是出来“文档被保存,但是语音识别的数据丢失,因为没有足够的空间存储这些数据。确保没有录音时关闭麦克风,并检查磁盘上的可用存储空间” 解决这个问题的办法是:在WORD里点工具—选项—保存—把嵌入语言数据前面的勾点没就行了。 ...
2006-12-04 12:05:00 95
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人