自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 关于搜索引擎的倒排索引技术

写一个桌面搜索引擎还不简单?只要了解一下倒排索引的概念,每个有兴趣的程序员,花点时间,都能写出来一个自己的桌面搜索引擎。为什么搜索引擎的查询速度这么快? 说明白了很简单,核心技术就是 “倒排索引”。“倒排索引”这个名词很唬人,其实原理很简单。假设有3篇文章,file1,file2,file3,文件内容如下: file1 (单词1,单词2,单词3,单词4....)file2 (单

2006-10-20 19:12:00 3432

原创 ftfind 桌面搜索引擎的设计文档 (2)

河南省青年创新软件设计大赛参赛作品说明书飞涛本机搜索引擎1.创意说明   背景介绍  尽管从互联网上数以十亿计的文档中搜索信息已经变得相对简单,但在计算机的硬盘上查找一个Word文件仍然不是一件容易的事。为了方便用户在越来越大硬盘里,从海量的资料中查找自己感兴趣的文档,我开发了本机搜索引擎,该软件能够以全文检索的方

2006-10-10 18:58:00 1575

原创 ftfind 桌面搜索引擎的设计文档 (1)

ftfind 桌面搜索引擎的设计文档 (1)马飞涛坦白地说,我设计软件时,和很多程序员一样,也不爱写文档。后来,发觉如果按软件工程要求,不爱写文档的程序员,就是不成熟的程序员,就是游击队,即使你编程技艺高超,也是山顶洞的史前野人。看看按软件工程的要求,都需要写些什么呢?一、可行性研究报告.dot二、项目开发计划.dot三、需求规格说明书.dot四、概要设计说明书.dot五、详细

2006-10-10 18:55:00 1394

原创 cppunit 印象

转贴于http://www.18ie.com/wordpress/?p=25看了好几天cppunit,代码读着真难受,简直让人恶心。 好几次,都想放弃用cppunit了,也不知道cppunit到底有何方便的,一帮子人在吹,到底谁在实践中用过? 还不如自己用assert()写测试,来的方便、快捷,容易读。 今天,总算找到一个容易明白些的例子,分析并写一下自己的体会 :class Si

2006-09-28 19:47:00 1016

原创 winx 印象

看了winx的介绍,计划很宏大。http://winxcn.blogspot.com/2006/09/004-hello-winx.html>>尽管目前尚且没没有专门针对WINX进行可视化界面开发的工具,但是它是WINX的发展方向.当没有可视化界面开发的工具的时候,我肯定不会用winx来进行开发。 替代方法是:一些人会选用c++ builder来编程;而我会采用delphi来写界面,用

2006-09-28 19:43:00 1124 1

原创 我写了一个桌面搜索引擎

上半年,我写了一个桌面搜索引擎,类似于google desktop search 。前几天,把它递交到河南省青年软件大赛,看看能得第几名。下一阶段,我准备按传统的软件工程的方法,结合极限编程的思想,重构 我的 本机搜索引擎http://www.18ie.com/find 。blog工具选来选去,决定采用wordpress,来记录这个重构历程。www.18ie.com/wordpre

2006-09-26 10:58:00 1234

原创 ftfind 对比 google desktop search

ftfind 对比 google desktop search我写完本机搜索引擎 ftfind 之后,下载了一个最新版的google desktop search。 做一个对比,立即找到了信心,可以欣喜地看到,在有些方面,ftfind已经暂时胜出。虽然有些细节没有google考虑周全,但是整体水平已经很接近,处在同一个重量级。测试平台:一台 奔三 750台式机,win xp操作系统。 

2006-09-26 09:49:00 1582

飞涛本机搜索引擎

1.ftfind 具备中英文全文检索功能。支持中文、英文混排。具备中文分词功能,精巧的数据结构设计,高效的查询算法,占用内存小,检索速度快。 2.可以对网页文件(*.htm)、纯文本文件(*.txt)、word文件(*.doc)、和源代码 *.c,*.h,*.cpp,*.pas,*.asp,*.php,*.java 等文件建立索引。支持Gb2312,utf-8等编码方式。 3.用户可以自行指定搜索范围,既可以增加多个文档,也可以增加选定的目录,或者增加整个硬盘里的所有文档。 4.灵活的模版化设计,稍具网页设计知识的用户,即可自行修改软件www目录下的搜索界面。 5.不用安装WORD软件,即可直接抽取并索引DOC文档。具备数据库自动修复功能,添加索引数据时,不怕计算机突然关机或系统崩溃。 ftfind与google桌面搜索的对比 1)ftfind 比goolge 的桌面搜索(desktop search)的安装文件小(755k vs 2311k)。 2)ftfind 只有1个进程;而google 的桌面搜索,需要5个进程。 3)ftfind对内存占用很少,远远胜出google的桌面搜索(7427k vs 57180k)。 4)ftfind 搜索速度比 google 桌面搜索的速度稍快。 (0.17秒 vs 0.21秒)。 5)ftfind是1个真正的免费软件,而google桌面搜索带有右侧广告窗口。

2006-09-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除