自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

搜索引擎、个性化推荐、大数据相关学习笔记|

工作多年在搜索、推荐算法、大数据这块领域深扎,业务与技术不断积累与成长,对业务、技术、算法有独道的思考

  • 博客(6)
  • 资源 (14)
  • 收藏
  • 关注

原创 自定义评分器Similarity,提高搜索体验

首先说一下lucene对文档的评分规则: score(q,d)   =   coord(q,d) ·  queryNorm(q) ·∑( tf(t in d) ·  idf(t)2 ·  t.getBoost() ·  norm(t,d) )具体可以查看相关文章:http://blog.chenlb.com/2009/08/lucene-scoring-architecture.html这里先考虑三个因素coord(q,d)与tf(t in d),当查询串中,命中的词越多,coord计算的值则越大,

2011-03-17 23:04:00 8890 1

原创 java 解析js脚本

<br />JDK6已经支持脚本语言了。写两个测试js的代码。<br /> <br /> <br />import javax.script.Invocable;import javax.script.ScriptEngine;import javax.script.ScriptEngineManager;import javax.script.ScriptException;import org.junit.Test;public class JS { @Test public

2011-03-11 16:50:00 5266

转载 nagios全攻略

<br />nagios全攻略(一)----准备阶段nagios全攻略(二)----基本安装和配置(上)nagios全攻略(二)----基本安装和配置(下)nagios全攻略(三)----使用插件监控更多信息nagios全攻略(四)----监控LINUX上的”本地信息”nagios全攻略(五)----监控windows系统的”本地信息”

2011-03-08 12:50:00 828

原创 拼写检查设计

1) 词库来源:词库来源在数据库中,以方便扩展,只要每天都会产生一个当天日期相关的搜索词库表,包含相关信息2) 建立索引采用二元循环切词:“背天而驰”->”背天”,”天而”,”而驰”,”驰背”以ConCurrentHashMap>结构存储,其中String为元切出的两个中文字符,CopyOnWriteArrayList存储相应文档,文档有三个属性,数据结构如下:/** * 唯一的标识 */private int id;/** * 文档内容 */private String text;/** * 搜索总数量 

2011-03-07 10:11:00 2901 1

转载 设计模式感悟

<br />原文http://linliangyi2007.javaeye.com/blog/512132<br />最近又把以前学习的模式过了一遍,感觉模式不是学出来的,是悟出来的! <br />做个简单的笔记,有空了看看,说不定时不时都有新感悟。 <br /><br />模式的法律(面向对象设计的基础准则) <br /> 

2011-03-04 18:27:00 779

转载 RedHat(CentOS)和Ubuntu安装软件命令对比(区别)

<br />此表内容来自《Ubuntu Server最佳方案》,CentOS和Ubuntu(Debian)是VPS最常见的系统,这份表很实用,分享下。<br /><br /><br /><br />转载请注明:来自pugWoo's Life<br />本文地址:http://www.pugwoo.com/2010/01/2/redhat-ubuntu-install-diff.html

2011-03-03 11:30:00 2365

56.com 视频推荐与大数据架构介绍

56.com 视频推荐与大数据架构介绍

2015-09-22

56 solrCloud分布式搜索与索引过程

2014-05-29

hadoop中文教程.pdf

hadoop中文教程 ,hadoop入门学习

2010-11-15

编程珠玑第二版中英源打包

编程珠玑第二版中英源打包,经典的算法题,读取第一页的时候,深深地被使用bit数组对大数据量快捷的排序方式给吸引住了。。

2010-08-04

sogou 词典 搜狗最新词典

sogou 词典 搜狗最新词典,对于做分词程序作用。。

2010-05-28

solr1.4 电子书

solr1.4 电子书 lucene Enhance your search with faceted navigation, result highlighting, fuzzy queries, ranked scoring, and more

2010-05-19

lucene3 原理介绍跟代码分析

lucene3 原理介绍跟代码分析 全文检索就存在三个重要问题: 1. 索引里面究竟存些什么?(Index) 2. 如何创建索引?(Indexing) 3. 如何对索引进行搜索?(Search) 下面我们顺序对每个个问题进行研究。

2010-04-08

JMS简明教程.pdf

企业消息产品(或者有时称为面向消息的中间件产品)正逐渐成为公司内操作集成的关 键组件。这些产品可以将分离的业务组件组合成一个可靠灵活的系统。 除了传统的MOM 供应商,企业消息产品也可以由数据库供应商和许多与网络相关的公 司来提供。 Java 语言的客户端和Java 语言的中间层服务必须能够使用这些消息系统。JMS 为Java 语言程序提供了一个通用的方式来获取这些系统。 JMS 是一个接口和相关语义的集合,那些语义定义了JMS 客户端如何获取企业消息产品 的功能。 由于消息是点对点的,所以JMS 的所有用户都称为客户端(clients)。JMS 应用由定义 消息的应用和一系列与他们交互的客户端组成

2010-03-15

Java JDK6学习笔记.pdf

很好的一本JAVA书籍,很适合初学者~ 一本好的启蒙书,让你少走更多的弯路~

2009-05-04

lucene做的桌面搜索

这个程序是用java做的桌面搜索,利用lucene API技术完成建立索引跟搜索功能,其它大部分功能是仿照火速搜索软件的,请大家多多指教,因为没时间完善,所以还存在很多缺点,特别是界面运行就比较慢~

2009-05-04

RCP程序设计.pdf

对做eclipse的插件感兴趣的好东西 RCP 富客户端的入门第一手资料

2009-04-06

精通Struts(Word版).pdf

精通 Struts 中文版 孙卫琴 经典书籍

2009-03-28

JSF+in+Action中文版.pdf

JSF 经典书籍 我希望JavaServer Faces in Action 能够激发你如我一般对此技术的热情,并且成为你自己项目开发的有用工具 本书是针对那些正在开发 Java web 应用的人— 架构师,应用开发人员和前端开发人员。在 我看来,架构师关心的是应用的设计,使用哪种技术,以及开发过程如何运作。开发人员则 构建模型对象,应用逻辑等等,而前端开发人员则具体构建GUI,通常使用象JSP 或者Velocity 之类的显示技术。在某些团队中,这些角色可能由相同的人承担,或者不同的角色具有重叠 的技能要求。JSF 是一个 web 应用框架,类似于Struts, WebWork, 或者Tapestry,但是本书 即使你之前从没有用过一种Web 框架也是可读的。

2009-03-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除