- 博客(0)
- 资源 (3)
- 收藏
- 关注
百歌搜索引擎tomcat嵌入版(Baioogle-SearchEngine Embed in Tomcat)
关于“百歌搜索引擎tomcat嵌入版(Baioogle-SearchEngine Embed in Tomcat)”的说明:
2008年5月份,因学习《信息检索》课程,本人利用java的开源搜索引擎库lucene,以及结合ajax技术google-suggest功能,模仿baidu、google的基本风格做了个“Baioogle-SearchEngine(百歌搜索引擎)”程序。
(源代码见csdn下载地址:http://download.csdn.net/source/482402)
后来,不时有人询问相关技术及操作,现给出嵌入了tomcat的版本,希望对大家学习有用。
--------------------------------------------
嵌入版的运行步骤:
1.启动“Baioogle-SearchEngine Embed in Tomcat”文件夹下的Start.bat,开启tomcat服务。
2.web浏览器中访问http://127.0.0.1/,等tomcat启动完毕后刷新即可看到网站界面如下图:
3.接下来的操作就和使用百度、谷歌类似了。
注:可以进入“...\Baioogle-SearchEngine Embed in Tomcat\apache-tomcat-5.5.28-embed\webapps\Root\cache”目录,执行里面的bat文件爬取感兴趣的网站,之后再建立快照及索引库。相关操作见随源代码附带的ReadMe.txt。
--------------------------------------------
Email:[email protected]
2011.6
2011-06-01
c#写的.NET 类库 (Utility.dll) using Utility.Popup
c#写的.NET 类库 (Utility.dll)
可以缓缓由底向上弹出窗口提示框
调用代码:
/*
* Author: zhg工作室
* E-mail: [email protected]
*/
using System;
using System.Collections.Generic;
using System.Drawing;
using System.Windows.Forms;
using Utility.Popup;
namespace demo
{
/// <summary>
/// Description of MainForm.
/// </summary>
public partial class MainForm
{
[STAThread]
public static void Main(string[] args)
{
Application.EnableVisualStyles();
Application.SetCompatibleTextRenderingDefault(false);
Application.Run(new MainForm());
}
public MainForm()
{
//
// The InitializeComponent() call is required for Windows Forms designer support.
//
InitializeComponent();
//
// TODO: Add constructor code after the InitializeComponent() call.
//
}
void Button1Click(object sender, System.EventArgs e)
{
PopupManager.setOwner(this);
PopupManager.setBeginingPosition(2, this.DesktopLocation.Y+this.Size.Height);
PopupManager.doPopup("友情提示", "当前时间"+DateTime.Now.ToString());
}
}
}
2009-09-29
Baioogle-SearchEngine(百歌搜索引擎)
关于信息检索系统——“Baioogle-SearchEngine(百歌搜索引擎)”的说明:
(注:本程序的tomcat集成版即精简了配置操作,另见下载地址 http://download.csdn.net/source/3332605)
===============================================================================
一、系统简介:
1.本系统为B/S结构的web应用系统,是基于Apache lucene(全文检索功能)以及ajax(GoogleSuggest功能)等技术开发的全文信息检索系统,目前仅支持对纯文本文件的检索
2.系统名称:Baioogle-SearchEngine,即“百(度谷)歌”搜索引擎
3.开发人:ZHG工作室 2008.5 (E-mail:[email protected])
4.其中src文件夹内为全部源代码,WebRoot为web应用部署文件
5.本系统的最小有效组件集合为:(约定:以下“*.*”均表示目录下的所有单独文件,不包括文件夹,而“/s”则表示所有的文件夹及其内部内容)
src\*.* /s
WebRoot\WEB-INF\classes\terms.mdb
WebRoot\WEB-INF\classes\dict\*.* /s
WebRoot\WEB-INF\classes\org\mira\*.class /s
WebRoot\WEB-INF\lib\lucene-core-2.3.1.jar
WebRoot\*.*
WebRoot\WEB-INF\index
WebRoot\WEB-INF\*.*
WebRoot\cache\wget.exe
WebRoot\cache\make-cache.bat
6.本系统最终运行组件包(发行包)仅包括WebRoot内的文件。src内的文件为本系统的源代码,但src中的内容要正常编译仍离不开WebRoot内的部分文件
二、注意事项:
1.关于以上所列出的最小有效组件集,对于非熟悉本系统开发原理者不应再进行缩减,否则可能不能顺利运行本程序
2.本系统依赖于网络爬虫软件wget的自动存放格式,如网址“http://127.0.0.1:8080”所对应的目录形式将为“http\127.0.0.1+8080”。但目前仅能处理省略端口的形式的网址(即端口为80时),未考虑其他端口时的情况(此局限之处有待完善)
3.如果要对站内文件进行索引,在运行建立索引命令时,最好将相应.bat命令文件中的路径参数改为绝对路径
4.由于参考了部分开源技术,故在开发过程中尽量保留原作者信息,如在版权等问题上有处理不当之处,纯属学习借鉴,无侵权之意,望见谅
5.本系统开源,在传播过程中请保持整个软件包的完整性。本软件仅供学习参考之用,所有权保留
三、使用步骤:
1.编译src中的*.java文件。(src的个目录下有compile.bat文件,可简化编译过程。由于现在(2008.5-zhg)发行时已经用jdk1.5+tomcat5.5编译过,故可跳过这步。如运行中提示版本错误,也可重新编译)
2.运行WebRoot\cache\make-cache.bat命令,来抓取网络资源,建立快照。
3.运行WebRoot\WEB-INF\IndexHTML-by-Cache.bat命令,来为快照网页建立索引。
4.运行WebRoot\WEB-INF\make-db.bat命令,从索引库中读取关键字信息自动存入WebRoot\WEB-INF\classes\terms.mdb中,以便GoogleSuggest功能使用
5.将WebRoot目录部署到web服务器(tomcat)中。(上下文路径可自定,建议定为“/baioogle”)
6.打开web浏览器输入相应地址(如“http://127.0.0.1:8080/baioogle”)即可进入本系统主界面
四、作者信息
-----------------------------------------------
-----------------Copyright©--------------------
-----------------------------------------------
------ Author:ZHG工作室 2008.5 -------
------ E-mail:[email protected] -------
------ All Rights Reserved -------
-----------------------------------------------
-----------------------------------------------
-----------------------------------------------
=====================================================================================
---Author:zhg 2008.5
2008-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人