- 博客(4)
- 收藏
- 关注
转载 Lucene 4.0 原理与代码分析 – 相似度评分算法之向量空间模型(VSM)
信息检索技术的发展也有些年头了,过程中诞生了不少优秀的检索模型,其中比较早的是VSM模型,虽然诞生的较早,但由于其原理简单直观并在检索性能(performance)和效率(efficiency)方面有较好的平衡,成为经典并直到今天依然被广泛使用,同时也是Lucene最先实现并被设为默认使用的检索模型,接下来我就对VSM检索模型的原理和在Lucene中的实现进行分析。 首先集中解释一下在下文中
2015-04-14 18:16:12
2664
1
转载 java线程相关
1) 什么是线程? 线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位。程序员可以通过它进行多处理器编程,你可以使用多线程对运算密集型任务提速。比如,如果一个线程完成一个任务要100毫秒,那么用十个线程完成改任务只需10毫秒。Java在语言层面对多线程提供了卓越的支持,它也是一个很好的卖点。欲了解更多详细信息请点击这里。 2) 线程和进程有什么区别? 线程是
2015-04-13 11:22:02
339
原创 solr4中HttpSolrServer使用的问题
前段时间,偶尔看到前端tomcat报异常,提示httpclient连接池满了,后来查阅了solrj源码,不自行定义httpclient的话,默认最大链接数是20,单主机最大是2,确实有点少。
2015-04-07 17:17:53
1216
转载 分布式与集群的区别
转载于:http://my.oschina.net/004/blog/170560 简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。 例如: 如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。 采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考
2015-04-03 17:28:34
336
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人