一、 配置方案
基于DPSEARCH的搜索引擎搭建在LINUX平台下;为此我们首先介绍一下整个平台的搭建过程:
1 数据库的选择与安装
基于DPSEARCH的移动搜索引擎 使用 MYSQL数据库;所以 首先在LIUNX 下进行 数据库的安装、配置;其具体步骤如下:
A 从 WWW.MYSQL.COM 上下载MYSQL 安装文件;MYSQL 安装文件分为 二进制 和RPM 包两种安装模式,这里我们建议最好使用 RPM 包进行安装,因为它将整个安装过程进行了简化,操作起来很简单;下载到的MYSQL RPM包 一般包括:MySQL-server-xxx-0.i386.rpm MySQL-shared-xxx-0.i386.rpm MySQL-client-xxx-0.i386.rpm MySQL-devel-xxx-0.i386.rpm 四个RPM 包;
B 在LINUX 下进入root 用户权限下(这一步很关键) 分别输入以下命令
Rpm -ivh MySQL-server-xxx-0.i386.rpm
Rpm -ivh MySQL-shared-xxx-0.i386.rpm
Rpm -ivh MySQL-client-xxx-0.i386.rpm
Rpm -ivh MySQL-devel-xxx-0.i386.rpm
MYSQL 安装程序将自动进行安装,安装完毕后你回发现 在/usr/local/ 下有MYSQL 的文件选项
C 启动MYSQL :
MYSQL 的启动在LINUX 下有两种方式:
(1)在终端直接启动 : service mysqld start ; 这需要在每次启动LINUX 后都进行操作 否则 MYSQL 会提示你:找不到 MYSQL-server 进程;(这种方案不提倡)
(2 ) 在 LINUX 的 服务选项 里面找到 mysql 然后打勾 选中它 ,这样每次启动LINUX时 系统将直接启动MYSQL 进程;
D 测试MYSQL
直接输入命令:mysql 回车
你会发现系统进入MYSQL 界面,并显示该MYSQL的版本号; 这样MYSQL 的安装 配置工作就结束了。
2 HTTP 服务器的安装、配置
A 下载 最新的HTTP 安装文件
B 安装 HTTP
#./ configure --prefix=/你要安装的路径/
# make
# make install
C 启动 HTTP 服务器
# cd /安装路径/
# cd apache
# cd bin
#./apachete1 start
在完成上述步骤后 你下载的HTTP服务器就成功启动了。
但LINUX系统本省也自带了HTTP服务器,启动系统自身的 HTTP 命令为:
# service httpd start
为了更有效的利用 HTTP服务器 建议直接去官方网站下载 HTTP的最新版本,并且启动时 使用下载版本。
接下来进入 搜索引擎的主题安装部分
3 DPSEARCH 的安装、配置流程
A 首先到 www.dataparksearch.org 上下载 dpsearch 搜索引擎软件;你可以根据改网站上提供的一些信息下载到最新的版本或则经过测试反馈最好的软件;我使用的版本是:dpsearch-4.37.tar ;安装、配置、使用起来都很方便;
B 解压 dpsearch-4.37.tar
# tar –zxvf dpsearch-4.37.tar
这样 系统将dpsearch-4.37.tar 解压到当前文件夹内;然后仔细阅读 INSTALL 文件找到安装dpsearch-4.37 的具体步骤;
C 安装dpsearch-4.37
# cd dp dpsearch-4.37
你会看到有一个可执行文件 install.pl 这就是安装的主程序 然后 运行命令
# ./install.pl
此时你会看到系统开始进行安装 在次过程中 系统会提示你很多选项我们这里就不一步一步的讲解 把主要的东西讲下(注:我们的数据库是 MYSQL);
当系统提示你选择数据库时 第一个选项值为 3 (none of above ) 第二个选项值为 6 (将数据库定位于MYSQL)其它的选项都为默认值,选择完毕后系统将自动安装文件;然后运行命令
# make
# make install
此时 dpsearch-4.37安装文件将dpsearch-4.37安装到先前默认的路径:/usr/local/dpsearch下 ;
D 接下来开始配置 dpsearch 使其开始工作:
(1)# cd /usr/local/dpsearch.-4.37
(2)# cp *.*-dist *.* // 即去掉你需要使用文件的 –dist
(3) # mysqladmin create search
创建搜索引擎的数据库 该数据库将保存你的所有搜索
(4) # cd /etc // “/usr/local/dpsearch-4.37/etc/
因为cached 模式需要使用search.cgi 所以我们必须编译第(2)步中所修改的文件即:indexer.conf, cached.conf , search.htm 首先 编辑这3个文件中的 dbadress 以dbmode = cache 结尾 同时修改数据库的用户和密码;此外在 indexer.conf 中还需要加入服务器的地址:即搜索引擎进行搜索的具体地址 ;在我们实验中是这样配置的 Server http://www.baidu.com/
(5)# cd /usr/local/dpsearch-4.37/sbin/
# ./ indexer –Tecreate
# ./ cached 2 > cached.out &
# ./ indexer -TZZZ // 将数据库清空
# ./ indexer
这个过程可能要花很长时间 因为它开始从你定义的Server服务器搜索数据并将数据写入数据库。
# ./indexer -TWH // 将数据写入Cached中 以迅速调用
# cd /bin // usr/local/dpsearch-4.37/bin
# cp search.cgi /usr/local/apache/cgi-bin/
即 将搜索接口 放入APACHE服务器中并启动搜索引擎使其工作
如果你想将你的搜索页面设置成为 APACHE的主界面 你还需要 拷贝 Search.htm 到 APACHE 下的 存放APACHE 主页的地方 同时覆盖掉原来的主页;这样每次打开浏览器 启动 httpd 服务后进入的就是你的搜索界面 。
至此一个完整的 Dpsearch-4.37的搜索引擎配置完毕 你可以在 Apache 中随意使用自己的搜索引擎。
二 启动服务器
# cd /usr/local/apache/bin/
# ./apachet1 start // 启动HTTP服务器
在你的HTTP地址栏中输入本机 IP 就会出现搜索引擎的前台:搜索接口(CGI接口)。在SEARCH:栏中输入欲查询的关键字系统调用SEARCH.CGI自动去数据库中搜索,并根据一定的搜索、排序算法,将匹配的结果以HTML的形式返回给用户。
至此:一个完整的搜索引擎成功实现;你可以用它来实现本站搜索,也可用来搜索其它站点的信息。