自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 邮件发送中的"server does not support secure connection."

 最近在修改公司的邮件发送系统。不熟悉C#,浏览代码以后,增加了通过SSL方式,GMAIL的smtp服务器需要SSL安全连接。测试通过,可以发送邮件。但是部署在备用机房服务器以后(windows server 2003),在发送的时候,报错,"server does not support secure connection."通过telent直接访问smtp.gmail.com,显示

2009-10-28 22:44:00 4168

原创 swish-e搜索引擎,代码分析(9)

在前面的内容中,通过对于词条的分析,排序、压缩等处理后,词条ENTRY目前是按照每个metaID一个LOCATION的结构进行存放。从本节开始,逐渐阐述索引文件的写入过程。2.6索引文件写入过程索引文件的写入主要是分为写入头部header过程和词条信息过程两部分。2.6.1 write_header头部写入过程 先通过DB_InitWriteHeader_Native将header

2009-10-18 20:51:00 514

原创 delicious FF插件不错

但是有点“坏”,居然在FF本身的【书签】上面增加了一个菜单,HIDE THIS MENU。引导别人。哈哈

2009-10-17 15:56:00 443

原创 nutch1.0 “Invalid first character”异常

根据http://lucene.apache.org/nutch/tutorial8.html中的tutorial,下载nutch-1.0,cygwin等进行配置。在使用bin/nutch crawl urls -dir crawl -depth 3 -topN 50进行抓取的时候,出现了Invalid first character,google到一些文章,说可能是craw-urlfil

2009-10-15 14:04:00 839

原创 swish-e搜索引擎,代码分析(8)

2.5.4 coalesce_word_locations函数分析coalesce_word_locations函数对于LOCATION的信息进行了合并,将同一个metaID的信息都放在了一个LOCATION中,不同的filenum,只是存放了差值。在index.c L 2847开始,循环遍历每个LOCATION,进行词条信息的合并。 /* Run on all location

2009-10-14 22:37:00 512

原创 swish-e搜索引擎,源代码分析(7)

前面部分对于词条进行了压缩等,从这部分开始分析索引文件的写入。2.5 索引文件写入2.5.1 write_index_file函数分析基本流程为:通过 coalesce_all_word_locations函数将词条按照metaID和filenum进行排序;通过sort_words对于词条进行排序;write_header写入索引文件头部;write_index写入

2009-10-13 23:34:00 661

原创 swish-e搜索引擎, 源代码分析(6)

在前面的部分中,对于swish-e读取文件内容,将分析所得的词条加入到hash表中的过程。当所有的词条处理完成以后,此时在sw->hashentries[VERYBIGHASHSIZE]表中则存放了所有的词条。此时需要对于这些词条进行一定的压缩处理,才能最后写入到索引文件中。本节开始,对于词条信息的压缩过程进行阐述。在index.c L1200开始进行Compress the en

2009-10-11 20:01:00 695

原创 swish-e代码分析,索引部分(5)

在前一节中通过getentry函数的处理,在hash表中查找是否含有该词条,如果没有,则初始化一个词条entry变量。然后通过addentry进行处理。 2.3.4 addentry函数分析 加入词条到hash表的过程主要分为两部分:已有词条、新词条。 Normal 0 7.8 磅 0 2 false false

2009-10-08 22:19:00 548

原创 swish-e代码分析,索引部分(4)

从本节开始,对于核心索引过程进行描述。 2.3 核心索引过程 对于每个需要索引的文件,先初始化一个FileProp结构,然后读取文件内容,解析词条等等。 2.3.1 FileProp函数 Normal 0 7.8 磅 0 2 false false false

2009-10-07 21:33:00 606

转载 从无到有之路(ZZ)

http://apple4.us/2009/09/from-nothing-to-something-1.html作者:Seth Sternberg;译者:Willow;原文链接我是那种就是不能停止创业的孩子。我想我真的害怕给别人打工。问题是,我以前在创业这件事情上似乎糟透了。屡战屡败。某些时候我会想说,“管他的,我可以拿到一份高薪工作。”问题是,我就是不能不去想那

2009-10-07 00:05:00 362

原创 swish-e代码分析,索引部分(3)

上一节中对于索引之前的初始化工作进行了分析,从这节开始,对于索引过程进行阐述。 2.2.3 indexPath索引文件过程 Normal 0 7.8 磅 0 2 false false false

2009-10-06 20:18:00 536

原创 swish-e代码分析,索引部分(2)

Swish-e通过配置文件,进行索引过程的配置。swish.c中main函数开始,首先通过swish_new()初始化SWISH变量;1.基本流程:1.1 SWISH初始化通过SwishNew()分配一个Swish指针变量,然后调用initModule_DB来初始化在索引过程中用到的文件读写函数,此时将索引文件的操作看做是DB操作;

2009-10-03 00:53:00 555

原创 swish-e代码分析,索引部分(1)

一直想将swish-e的代码分析进行整理,趁着国庆,发布其中的内容,尽快地整理好。用的是swish-e 2.4.7版本。先对于SWISH-E搜索引擎中的主要数据结构进行介绍。1. 索引相关的主要数据结构1.1 SWISH-E定义了SWISH结构对于索引,搜索过程进行处理,其中有MOD_Index结构       struct MOD_Index{

2009-10-02 00:41:00 692

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除