自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 Lucene 4.0 原理与代码分析 – 相似度评分算法之向量空间模型(VSM)

信息检索技术的发展也有些年头了,过程中诞生了不少优秀的检索模型,其中比较早的是VSM模型,虽然诞生的较早,但由于其原理简单直观并在检索性能(performance)和效率(efficiency)方面有较好的平衡,成为经典并直到今天依然被广泛使用,同时也是Lucene最先实现并被设为默认使用的检索模型,接下来我就对VSM检索模型的原理和在Lucene中的实现进行分析。   首先集中解释一下在下文中

2015-04-14 18:16:12 2664 1

转载 java线程相关

1) 什么是线程? 线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位。程序员可以通过它进行多处理器编程,你可以使用多线程对运算密集型任务提速。比如,如果一个线程完成一个任务要100毫秒,那么用十个线程完成改任务只需10毫秒。Java在语言层面对多线程提供了卓越的支持,它也是一个很好的卖点。欲了解更多详细信息请点击这里。 2) 线程和进程有什么区别? 线程是

2015-04-13 11:22:02 339

原创 solr4中HttpSolrServer使用的问题

前段时间,偶尔看到前端tomcat报异常,提示httpclient连接池满了,后来查阅了solrj源码,不自行定义httpclient的话,默认最大链接数是20,单主机最大是2,确实有点少。

2015-04-07 17:17:53 1216

转载 分布式与集群的区别

转载于:http://my.oschina.net/004/blog/170560 简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。 例如: 如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。 采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考

2015-04-03 17:28:34 336

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除