![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
gao675597253
这个作者很懒,什么都没留下…
展开
-
简单的分词程序
本程序没有复杂的逻辑,只是简单的分解英语单词,分割标点,汉语分成单个字,仅仅为了展示分词过程是怎么实现的。有难度的分词算法有待进一步研究。package chapter2;import java.io.*;import java.net.*;public class WebParserFilter {/*** @param args*/priva原创 2012-03-31 23:37:54 · 594 阅读 · 0 评论 -
一个简单的搜索引擎程序
一个简单的索引和搜索引擎程序,简单到让你无法相信package chapter2;import java.io.*;import java.util.*;public class WordIndex {/*** @param args*/static Hashtable KeywordIdx;//哈希表用来建立倒排索引static S原创 2012-04-01 10:20:19 · 518 阅读 · 0 评论 -
Html页面内容提取与过滤(很简单的例子、适合初学者)
第一种方案:简洁直观的逐个字符检查,去除html标签、空格、回车、换行、制表符等,代码如下:package chapter2;import java.io.*;import java.net.*;public class WebParser {/*** @param args*/private static String src_File_Path原创 2012-03-31 23:12:45 · 1105 阅读 · 0 评论