自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

搜索引擎、个性化推荐、大数据相关学习笔记|

工作多年在搜索、推荐算法、大数据这块领域深扎,业务与技术不断积累与成长,对业务、技术、算法有独道的思考

  • 博客(6)
  • 资源 (14)
  • 收藏
  • 关注

原创 hadoop学习(mac 上安装 hadoop伪分布式以及hadoop的eclipse插件)

mac上安装 hadoophttp://andy-ghg.iteye.com/blog/1165453安装后运行bin/hadoop namenode -format 抛出一个warn:2012-06-29 23:28:25.852 java[3256:1903] Unable to load realm info from SCDynamicStore

2012-06-29 23:14:47 6395

转载 Hive的JDBC方式编程

原文 http://user.qzone.qq.com/165162897/blog/1276050795#!app=2&pos=12760507951.启动hiveServer./hive  --service hiveserver2.编写jdbc代码(hiveExample.java)import java.sql.SQLException;im

2012-06-27 10:56:59 2470

原创 优化solr全量建索引,减少索引时间

优化solr全量建索引主要优化从数据库取数据这一块。先简单为读取某个单表数据:该表数据很多娄,数据库为MySQL。旧的建索引设计:之前的设计是分段读取数据,可以按自增主键分段或者按记录更新的时间截分段取。但由于数据模型是可增删改查,这种更新会导致按自增id的数据在有些地方比较稀疏,而按记录的更新时间截,也有可能在某个时间段里更新大量数据,所以也会有不同时间段数据过稀或者

2012-06-25 21:08:48 13777 1

转载 基于Solr和Zookeeper的分布式搜索方案SolrCloud

http://no1zhangye-hotmail-com.iteye.com/blog/1420316 SolrCloud 是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的Solr4.0的核心组件之一,它的主要思想是使用Zookeeper作为集群的配置信息中心。         它有几个特色功能:         1)集中式的配置信息

2012-06-09 00:14:44 21226

转载 文档与笔记利器 reStructuredText 和 Sphinx

原文http://qixinglu.com/archives/note_tools_restructuredtext_sphinx文档与笔记利器 reStructuredText 和 Sphinx28六 2011# 作者: 投稿/转载 / 本文采用CC BY-NC-SA 2.5协议授权,转载请注明本文链接。本文转载自七星庐 [ 原文:

2012-06-03 23:06:07 5244

原创 学习cpp的笔记

统计小写字母各个字符出现的次数:#include using namespace std;int main() { const string *_input=new string("abcedasdfasgeaegqwggqewhewqqhweasdgashqwehq"); const string &input=*_input; int count[26]={0};

2012-06-03 20:59:05 771

56.com 视频推荐与大数据架构介绍

56.com 视频推荐与大数据架构介绍

2015-09-22

56 solrCloud分布式搜索与索引过程

2014-05-29

hadoop中文教程.pdf

hadoop中文教程 ,hadoop入门学习

2010-11-15

编程珠玑第二版中英源打包

编程珠玑第二版中英源打包,经典的算法题,读取第一页的时候,深深地被使用bit数组对大数据量快捷的排序方式给吸引住了。。

2010-08-04

sogou 词典 搜狗最新词典

sogou 词典 搜狗最新词典,对于做分词程序作用。。

2010-05-28

solr1.4 电子书

solr1.4 电子书 lucene Enhance your search with faceted navigation, result highlighting, fuzzy queries, ranked scoring, and more

2010-05-19

lucene3 原理介绍跟代码分析

lucene3 原理介绍跟代码分析 全文检索就存在三个重要问题: 1. 索引里面究竟存些什么?(Index) 2. 如何创建索引?(Indexing) 3. 如何对索引进行搜索?(Search) 下面我们顺序对每个个问题进行研究。

2010-04-08

JMS简明教程.pdf

企业消息产品(或者有时称为面向消息的中间件产品)正逐渐成为公司内操作集成的关 键组件。这些产品可以将分离的业务组件组合成一个可靠灵活的系统。 除了传统的MOM 供应商,企业消息产品也可以由数据库供应商和许多与网络相关的公 司来提供。 Java 语言的客户端和Java 语言的中间层服务必须能够使用这些消息系统。JMS 为Java 语言程序提供了一个通用的方式来获取这些系统。 JMS 是一个接口和相关语义的集合,那些语义定义了JMS 客户端如何获取企业消息产品 的功能。 由于消息是点对点的,所以JMS 的所有用户都称为客户端(clients)。JMS 应用由定义 消息的应用和一系列与他们交互的客户端组成

2010-03-15

Java JDK6学习笔记.pdf

很好的一本JAVA书籍,很适合初学者~ 一本好的启蒙书,让你少走更多的弯路~

2009-05-04

lucene做的桌面搜索

这个程序是用java做的桌面搜索,利用lucene API技术完成建立索引跟搜索功能,其它大部分功能是仿照火速搜索软件的,请大家多多指教,因为没时间完善,所以还存在很多缺点,特别是界面运行就比较慢~

2009-05-04

RCP程序设计.pdf

对做eclipse的插件感兴趣的好东西 RCP 富客户端的入门第一手资料

2009-04-06

精通Struts(Word版).pdf

精通 Struts 中文版 孙卫琴 经典书籍

2009-03-28

JSF+in+Action中文版.pdf

JSF 经典书籍 我希望JavaServer Faces in Action 能够激发你如我一般对此技术的热情,并且成为你自己项目开发的有用工具 本书是针对那些正在开发 Java web 应用的人— 架构师,应用开发人员和前端开发人员。在 我看来,架构师关心的是应用的设计,使用哪种技术,以及开发过程如何运作。开发人员则 构建模型对象,应用逻辑等等,而前端开发人员则具体构建GUI,通常使用象JSP 或者Velocity 之类的显示技术。在某些团队中,这些角色可能由相同的人承担,或者不同的角色具有重叠 的技能要求。JSF 是一个 web 应用框架,类似于Struts, WebWork, 或者Tapestry,但是本书 即使你之前从没有用过一种Web 框架也是可读的。

2009-03-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除