自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wangzhengnb的专栏

互联网,搜索技术

  • 博客(9)
  • 收藏
  • 关注

原创 iPhone应用开发视频教程-斯坦福大学公开课

以下是一套由美国斯坦福大学(Stanford University)在2013年初推出的一套iPhone应用程序开发视频教程,详细讲解了iPhone4/iPhone4s/iPhone5/iPad等iOS平台终端上app应用程序的开发。[第1集] iPhone开发视频教程-基础入门http://d.119g.com/f/DE651F43C89C8CAB.html

2013-05-15 16:49:52 1820

原创 斯坦福大学机器学习公开课视频及课件

下面是这段时间学习机器学习时下载的一些视频学习资料,斯坦福这套机器学习公开课是其中相当牛X的一个。 公开课的教授Andrew Ng不得不提,能够把很抽象的机器学习过程讲得很清楚,小弟看了这套公开课资料表示那真叫一个受益匪浅啊。 Andrew Ng前段时间好像还到THU和百度做讲座来着。 这算是机器学习一套非常适合入门(不过到了后面也相当深)的敲门砖,不过一定一定记住要对着andrew

2013-04-17 00:01:34 4782 5

原创 解决vim配置.vimrc报错问题

在虚拟机上装了个ubuntu,给他加配置的时候出了一个诡异的问题,在此mark一下。《强大的vim配置,让编程更随意》http://www.cnblogs.com/ma6174/archive/2011/12/10/2283393.html可以从这个网页上找到下载一个配置下载下来之后,打开vi,发现了这个问题开始还以为是中文的问题,然后把中文

2012-08-08 13:05:45 7101

原创 lucene索引结构(六)--词位置(.prx)倒排索引文件结构分析

1. 作用    词位置倒排索引存在的意义是什么呢?    在web搜索中,绝大多数情况都是自由文本搜索。用户期望很简单的输入一些词语串,搜索引擎就能匹配出与之相关的文档。而词项位置信息,在搜索引擎进行匹配和打分的过程中,提供了很重要的信息。    例如,    文档1包含"I promise I will always love you"。    文档2包含"You

2012-07-29 18:24:58 3299 1

原创 lucene索引结构(五)--词频倒排索引(frq)文件结构分析

我们在上节,lucene索引结构(四)中分析了lucene倒排索引的词典部分。    词典的作用就是让程序查询词项是否存在,将词项倒排(posting)记录的地址返回。    Lucene中,一个词项的倒排有词频信息和位置信息两部分。    其中词频信息记录存储了某词项在一系列文档中出现了多少次,位置信息记录的是词项在文档中出现的一系列位置。    他们分别被存储在.frq

2012-07-28 23:36:07 5339

原创 lucene索引结构(四)-词典(Term Dictionary)索引文件结构分析

搜索引擎检索系统索引的核心是什么?    显然是反向索引。    好了,现在我们开始介绍反向索引部分。0. 一些说明    反向索引分成两部分,如下图(图来自《信息检索导论》):        左面是词项词典(Term Dictionary),右边是倒排记录表(Posting)。        在Lucene中,词典和倒排是分开存储的,词典存储在

2012-07-26 17:35:04 7336

原创 lucene索引结构(三)-词项向量(TermVector)索引文件结构分析

0. 事先对代码进行的一点修改     当我准备开始分析此项向量索引文件的时候,突然发现我的索引程序生成的索引文件里没有.tvx,.tvd,.tvf这三个文件。看了看lucene文档,才知道了"Term Vector support is an optional on a field by field basis. "。          喔!原来是个可选的。那么意思就是说不生成这种索

2012-07-24 22:40:37 8866

原创 lucene索引结构(二)--域(Field)信息索引

1. 域(Field)的元数据信息(.fnm)文件分析1.1 作用     我们在为文档建立索引的时候,会为文档添加不同的域(字段)来进行索引,使得索引结构能满足更多的查询语法。例如一个文档集被索引了author,modifydate字段,那么就能支持 'author:wangzhengnb AND modifydate>20120722' 这种Query语法。     更真实的例子就

2012-07-22 19:46:56 3000 1

原创 lucene索引结构(一)--segment元数据信息

今天起开始深入分析Lucene 3的索引结构。那就从最初步的段索引开始搞吧。1. 建立索引开始分析之前必须要创建索引,这里图省事啦,也没有去网上找什么文档集。直接拿lucene的doc来索引的,这是一堆html的文件,这里只索引了文件的路径、最后修改时间和内容。 doc.add(new Field( "pat

2012-07-21 22:45:53 11416

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除