- 博客(11)
- 资源 (42)
- 收藏
- 关注
原创 java 队列与堆的简单实现
package QueueAndStack;public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxSize) { arr = new long[maxSize
2015-02-09 14:57:05 551 1
原创 lucene一个TermFilter的简单实现 - 原理篇
public abstract DocsEnum docs(Bits liveDocs, DocsEnum reuse, int flags) throws IOException; 经过一天的研究,总算有些进展. 希望大家提出各种意见,欢迎拍砖! lucene版本:4.3.1 小插曲,原本想写写spetial search,但是研究研究着,就了解到了termFilte
2015-01-05 18:13:36 1408 1
有道云笔记添加收藏功能实现原理
今天早晨,莫名其妙的对火狐浏览器的"收藏到有道云笔记"感兴趣了. 右键点击属性后发现地址栏竟然是一段js.这不得不让自己想起曾经玩qq空间的时候,同样在url上打了一通js完成了空间的小挂饰功能. javascript:(function(){CLIP_HOST='http://note.youdao.com/yws';try{var%20x=document.createE...
2014-05-09 10:57:09 851
转载 lucene倒排索引原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这
2012-06-15 17:31:14 613
转载 利用Lucene搜索Java源代码(2)
import org.apache.lucene.document.*;import org.apache.lucene.index.*;import com.infosys.lucene.code.JavaParser.*;public class JavaSourceCodeIndexer { private static JavaParser parser = new Ja
2012-06-15 16:51:37 616
转载 利用Lucene搜索Java源代码(1)
某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的知识库,于是网站提供搜索引擎来搜索站点上现有的所有信息。虽然这些搜索引擎对文本文件的搜索可以做的很好,但对开发者搜索源代码做了比较严格的限制。搜索引擎认为源代码就是纯文本文件,因此,在这一点上,与成熟的可以处理大量源文件的工具――grep相比没有什么不同。
2012-06-15 16:29:48 825 1
转载 安装 Tokyo Cabinet 和 Tokyo Tyrant
原文出处:http://blog.chenlb.com/2009/03/install-tokyo-cabinet-and-tokyo-tyrant-start-ttserver.htmlTokyo Cabinet 是一款 DBM 数据库,与Berkeley DB是同类产品,但性能要好。Tokyo Tyrant 是Tokyo Cabinet 的数据库网络接口。它拥有Memcached兼容协
2012-05-22 15:33:39 694
原创 URLConnection,HttpURLConnection 使用总结 - 网络爬虫基础版
针对JDK中的URLConnection连接Servlet的问题,网上有虽然有所涉及,但是只是说明了某一个或几个问题,是以FAQ的方式来解决的,而且比较零散,现在对这个类的使用就本人在项目中的使用经验做如下总结: 1:> URL请求的类别:分为二类,GET与POST请求。二者的区别在于:a:) get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet,b:)
2012-03-31 11:39:15 1265 3
原创 mysqldump局部数据导入的使用之limit
mysqldump -uuser -p dbname tablename --where '1=1 limit 5' | gzip > /home/usr/usr/test.sql 这样便 实现了 limit的数据导出
2011-07-12 11:32:08 808
原创 我决定放弃庖丁分词器而使用极易分词
这一段时间,研究了下lucene的分词器.一向喜欢paoding分词器的决定使用极易分词. :shock: 为什么呢? 这段时间从google上下载了paoding的分词器和example.安装上后,发现paoding2.0+lunene2.2.0这样的版本做的样例.由于lucene目前最新的版本是lucene3.3.我将paoding分词扔给lucene后发现...
2011-07-11 14:41:39 199
转载 主题:Lucene Hack之通过缩小搜索结果集来提升性能 (1)
<br />作者:caocao(网络隐士),http://www.caocao.name,http://www.caocao.mobi <br />转载请注明来源:http://www.javaeye.com/topic/78884 <br /><br />一、缘起 <br />Lucene在索引文件上G之后的搜索性能下降很严重,随便跑个搜索就要上0.x秒。如果是单线程搜索那么性能尚可,总可以在0.x秒返回结果,如果是Web式的多线程访问,由于Lucene的内部机制导致数据被大量载入内存,用完后立即丢弃,随
2011-04-15 10:21:00 468
myeclipse 8.5 注册码生成程序
2012-08-13
lucene3.3的全部jar包
2011-07-18
lucene 3.3 core的源码包 lucence3.3_src.zip
2011-07-18
lucene-queries-2.9.0.jar 内含有org.apache.lucene.search.DuplicateFilter
2011-07-18
struts-2.2.3-lib.zip struts2.jar 全部jar包
2011-05-30
lucence api lucence.chm 帮助文档
2010-12-23
linux ssh 客户端 服务端 window服务端linux服务端 安装配置等 搜集整理较全
2010-10-13
自己的flex全部资料 flex中文帮助文档 flex java中文帮助文档 flex 实例 flex入门 ...
2010-04-23
dwr engine.js jsutil.js rar dwr.jar 项目中正在使用的东西
2010-04-13
commons-logging.jar commons-logging jar 下载
2010-04-13
软件工程教程+++ppt.rar 详细的 UML
2010-04-06
mysql-connector-java-5.1.5-bin.jar mysql 连接驱动
2010-04-02
ibatis 配置教程 本人通过此文档学会写ibatis实例
2010-04-02
ibatis-2.3.0.677.jar ibatis jar 包 下载 绝对可用
2010-04-02
最全的lucence.jar包,含有高亮器 SWING等包 正在使用中
2010-03-30
JAVA JDK 1.6 中文 chm 帮助文档
2010-03-30
Linux shell 及常用命令介绍.txt Linux shell 及常用命令介绍.txt
2010-03-30
DownloadPicture.java 流下载图片实例
2010-03-17
Eclipse显示中文JAVA+JDK+API方法.doc
2010-03-17
Windows下Resin的配置与部署.txt
2010-03-17
lucence.jar jar包 下载
2010-03-03
myeclipse blue 注册码下载
2009-12-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人