- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 kdtree
kd树类似于geo hash,只不过是对点进行二分,用于范围查询和knn(k-nearest neighbors)查询。实现如下:KDTree.java:import java.util.Collections;import java.util.LinkedList;import java.util.List;import java.util.Stack;
2016-01-26 18:37:06
1711
原创 Lucene BooleanQuery实现
BooleanScorer 只有OR条件的打分,打分只在一个2K documents的窗口中进行,每次拿到的doc不是顺序的,所以只用在top level query其他在BooleanScorer2中处理,多个And条件串成一个ConjunctionScorer,总是先advance最短的链,多个OR条件构成DisjunctionScorer,required条件和not条件使用ReqExc
2016-01-26 17:02:46
1086
转载 zookeeper运维参考文档
faq:http://jm-blog.aliapp.com/?p=1384日志清理:http://nileader.blog.51cto.com/1381108/932156zookeeper管理员指南:http://itindex.net/detail/40187-zookeeper-%E7%AE%A1%E7%90%86%E5%91%98-%E7%AE%A1%E7%90%86
2016-01-20 17:51:33
569
原创 curator PathChildrenCache
curator-recipes 2.7.1中的PathChildrenCache一般使用POST_INITILAIZED_MODE模式启动,RECONNECTED时会自动做rebuild操作,listener都在一个后台executor中完成。因为可能出现false-positive(误报)和false-negative(漏报),一般需要定期做rebuild。另外这个实现有个潜在问题,比较
2016-01-20 15:29:50
1946
原创 Curator-framework源码笔记
CuratorFrameworkFactory中有个Builder,每次建新节点defaultData都是ip,也可以设置,压缩provider可以进行设置CuratorFramework接口实现了Closeable接口,提供了多数操作,重点留意inTransaction,sync鞥操作,因为内部保存internal watcher,可能阻碍gc,需要调用clearWatcherReferen
2016-01-19 17:58:13
3255
原创 索引截断搜索的一种方法
索引里面不需要保持按某个分递增文档,这样建索引时限制太多,也只能支持一种截断方式。另一种做法索引相应分数,liveDocSet里面保存每个term之前和之后的文档总数,当然麻烦在于每次删除文档都需要更改相应计数数值。这种方案无疑非常棒,另外内存索引如果要支持range query和prefix query需要词典结果改成可以顺序访问的结果而不是哈希表。
2016-01-10 22:00:10
1605
原创 curator client 2.7.1源码笔记
curator有四个包,curator-client,curator-test,curator-framework,curator-recipes,其中curator-client和curator-test是最基础的,curator-framework依赖这两个包,curator-recipes又依赖curator-framework。curator-client总共不过三多行代码,记录一下:
2016-01-06 12:14:21
969
Scons User Guide 2.01
2011-05-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅