搜索引擎
jolestar
这个作者很懒,什么都没留下…
展开
-
一个源代码搜索引擎
一个源代码搜索引擎包括大多数程序语言,做的还不错.值得关注.www.koders.com/2007-02-23 00:18:14 · 429 阅读 · 0 评论 -
自己写的一个基于词库的lucene分词程序--ThesaurusAnalyzer
前一段时间用lucene做一个搜索程序,找了好长时间的中文分词程序,都没找到合适的,最后自己弄了一个.现在共享出来.希望对大家有用. 分词算法: 基于词库的正向最大匹配算法. 分词词库用的是网上一个叫 segmenter 的分词程序使用的词库. 地址:www.mandarintools.com/segmenter.html ...2007-03-10 02:22:45 · 213 阅读 · 0 评论 -
搜索引擎URI编码的处理
做一个站内搜索遇到一个问题:网站全站使用的是UTF-8编码,所以get请求的URL也用UTF-8编码,服务器端用UTF-8解码。这种情况下,用户直接在表单里输入提交过来搜索,是没有问题的。但如果用户直接在浏览器地址栏里把关键词给改了,提交过来,或者从浏览器地址栏的下拉提示列表里点击过来,URL编码就不确定了。这个和操作系统语言以及浏览器相关。 ie默认情况下,对在地址栏里输入的URL路...2009-04-13 19:32:10 · 466 阅读 · 0 评论 -
Lucene范围查询(RangeQuery)的几个问题
对要进行范围查询(RangeQuery)的字段 创建索引的时候要按照 储存 不分词 的方式创建索引。 new Field(name, value, Field.Store.YES, Field.Index.UN_TOKENIZED); 1.数字的范围查询对数字进行范围查询,必须先把数字格式化为一样长度的字符串。位数不够的在前面补零。如:NumberFormat format = N...2008-12-04 19:28:38 · 1179 阅读 · 0 评论