- 博客(10)
- 资源 (16)
- 收藏
- 关注
原创 【北大天网搜索引擎TSE学习笔记】第6节——获取用户输入
这一节将介绍搜索功能入口程序TSESearch.cpp的第二步——获取用户输入。(一) 获取用户在浏览器中输入的查询数据,需要跟web服务器进行数据交互,这就用到了前面提到的CGI方式。如果对CGI程序还是不太熟悉,请先阅读相关资料学习(推荐:http://blog.csdn.net/lewsn2008/article/details/8519908)。这里简单叙述一下,
2013-01-25 10:44:53 2428
原创 【北大天网搜索引擎TSE学习笔记】第5节——准备数据
上一节对搜索功能的入口程序TSESearch.cpp的main函数做了介绍,对搜索功能的实现的流程有了大概的了解,从这节开始讲对上节中提到的几个主要流程——准备数据、获取用户输入、中文分词、检索关键词、结果排序和显示搜索结果进行详细的分析。这一节分析准备数据的源代码。(这一节的内容非常简单,明白的朋友可以直接略过) (1)加载字典 上一节的main函数中第1
2013-01-23 21:23:43 2354 2
原创 【北大天网搜索引擎TSE学习笔记】第3节——从用户点击“搜索”按钮开始
在第一节中已经将查询服务子系统搭建起来,可以在天网搜索引擎的首页中输入搜索字符串、点击搜索按钮并得到搜索的结果页面。那后台到底是怎么处理的呢?怎么从网页获取用户输入然后调用搜索程序进行搜索呢?大家在这一节将得到答案。我们从用户操作开始入手,首先呈现在用户面前的是天网搜索的首页,第一节中已经说明该首页的页面文件就是/var/www/html/index.html,我们先看看该文件
2013-01-22 13:42:43 2591
原创 【北大天网搜索引擎TSE学习笔记】第4节——实现搜索功能的入口程序
上一节中说到,TSESearch.cpp是实现搜索功能的入口程序,这一节将分析TSESearch.cpp源代码。在看源代码之前,先梳理一下该程序中的主要步骤:(1)准备数据在第二节中介绍了系统中一些重要的数据文件,这些文件便是实现搜索功能所需的数据文件,如:字典文件、倒排文件、网页索引文件和URL索引文件等。程序第一步需要读取这些文件的内容为搜索做好准备。(2)获取用户输入获取用户
2013-01-21 20:38:55 2332
转载 【转】c++ web编程:写出你的CGI程序(英文)
原文地址:http://www.tutorialspoint.com/cplusplus/cpp_web_programming.htmWhat is CGI ?The Common Gateway Interface, or CGI, is a set of standards that define how information is exchanged betwee
2013-01-20 16:14:24 2868
转载 【转】c++ web编程:写出你的CGI程序
转自:http://www.cnblogs.com/moonlove/archive/2012/02/22/2509147.html英文原文地址:http://www.tutorialspoint.com/cplusplus/cpp_web_programming.htm一 什么是CGI CGI(The Common Gateway Interface):通用网关
2013-01-19 13:12:49 5387
原创 【北大天网搜索引擎TSE学习笔记】第2节——重要数据文件介绍
本节对系统中的主要的数据文件做一个简单的介绍,方便后面对系统源代码的阅读和对系统的理解。以下如不特别说明,所有路径或者文件都是相对于index目录而言的,即以index为当前目录。(1) ./ChSeg/words.dict为词典文件,包含该系统支持的所有中文单字、词以及标点符号等,该词典是中文分词的依据,直接决定了分词的结果。该文件中每条记录为一行,包含三项数据,第一个为序号,第二个
2013-01-15 13:31:22 3655 1
原创 【北大天网搜索引擎TSE学习笔记】第1节——环境搭建
最近在看《搜索引擎——原理、技术与系统》一书,同时下载了书中介绍的原型系统——北大天网搜索引擎TSE的源代码进行学习。之前没有任何搜索引擎方面的基础,也没有web开发经验,一切从零开始学习。为了记录学到的知识以备日后之用,也为了与大家分享并一起学习探讨,将学习的过程整理成笔记,连载发布于本博客。声明一下,我不是高手,我是菜鸟,从零开始学习,所以如果文中有错误之处敬请大家批评指出,也欢迎感兴趣的朋友
2013-01-09 11:30:39 8719 14
原创 我的vim配置(带注释)
我的vim配置(带注释),比较简单实用,以后根据功能的添加会不断更新。有需要的朋友拷贝以下内容放入用户家目录的.vimrc文件中,重启vim即可。另外多啰嗦两句:1、用户家目录,如我的linux当前用户名为andy,则默认的家目录为/home/andy,命令行中也可以通过 cd ~ 命令进入;2、.vimrc文件为隐藏文件,在家目录中通过命令 ls -l 可查看到。"---
2013-01-06 11:09:36 4203
转载 【转】倒排文件索引(Inverted File Index)的建立
建立索引目前主流的索引技术有三种:倒排文件、后缀数组和签名。后缀数组的方法虽然快,但是其维护困难,代价相当高,不适合做引擎的索引。签名是一种很好的索引方式,但倒排文件的速度和性能已经超过了签名。倒排文件是一种在各大搜索引擎中被主要使用的索引的方式,并且它也是搜索引擎中一个核心的技术。5.2.1 倒排文件索引(Inverted File Index)的建立倒排索引文件是一种
2013-01-04 15:00:30 2545
PackagingGuide_Debian打包.pdf
2015-01-21
deb包制作+软件图标+加到系统菜单实例
2014-10-15
Logistic回归总结(非常好的机器学习总结资料)
2013-11-13
新浪微博Python-SDK发微博(有详细博客文章)
2013-06-15
正向最大匹配中文分词算法
2013-02-26
C++函数调用过程深入分析
2011-08-11
MFC电子时钟屏保程序
2009-07-28
VC编的简易贪食蛇游戏
2009-07-28
SLAM经典入门教程
2009-07-24
计算机图形学算法程序包
2007-07-11
C语言图书管理系统源代码
2007-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人