自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (37)
  • 收藏
  • 关注

原创 ClassLoader.findBootstrapClass(String) line: not available [native method]

Thread [main] (Suspended (exception ClassNotFoundException)) ClassLoader.findBootstrapClass(String) line: not available [native method] Launcher$ExtClassLoader(ClassLoader).findBootstrapClass0(Str

2008-08-08 16:37:00 4329 2

原创 网络蜘蛛Spider简介

 网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网

2008-08-05 16:21:00 1471

原创 中英文颜色对照表(css)

                                                       中英文颜色对照表 颜色英文代码形像颜色HEX格式RGB格式 LightPink浅粉红#FFB6C1 255,182,193 Pink粉红#FFC0CB 255,192,203 Crimson

2008-08-05 14:54:00 1419

原创 详细信息页面(detail.jsp)

这个页面说起来就是main.jsp的子页面,除了${param.id}方法陌生以外,其他都在main.jsp中见过。详细代码如下:"java" contentType="text/HTML;charset=utf-8" %> "Content-Type" content="text/html; charset=gbk">"${pageContext.request.

2008-08-05 12:27:00 1079

原创 ${param.id}用法

 ${id} 意思是取出某一范围中名称为id的变量。 它的取值范围Page,Request,Session,Application。 ${param.id} 与输入有关,相对于 request.getParameter("id")。意思是获得输入的参数id。 因为a.jsp提交到b.jsp过程中,id不属于Page,Request,Session,Application任何范围中的一个,所以取不到

2008-08-05 12:09:00 1501

原创 前台实现的bean类

SearchResult:package com.luceneheritrixbook.searchengine.bo;import java.util.Date;public class SearchResult {    private int id;    private String abstractContent;    private S

2008-08-04 23:26:00 609

原创 检测main.jsp

 今天一天什么都没干,就检查了一下搜索引擎的main.jsp.害我浪费这么长时间的源头是:Sorry,we cant find what you want……一直不出来,导致我一遍一遍的调。本来以为是其他类的原因,特别是那个filter类(最后发现这些于我的错误都无关紧要)错误代码如下:%@ page language="java" import=

2008-08-03 23:03:00 700

原创 J2EE之filter的应用

J2EE提供了一种特殊的Servlet,就是Filter。它不是一种单独的网络组件,因为它不产生请求和响应信息,它必须依附于其他的网络组件存在。所以我们利用它完成信息的编码转化、数据加密、身份验证、数据压缩、日志记录等很多种工作。下面我们共同看一下Filter的结构和具体的应用方法,并且结合实例进行讲解。  一、Filter的结构  我们自己编写的Filter必须要实现javax.serv

2008-08-03 10:21:00 539 1

原创 web.xml错误之最终检验

 唉!终于找到web.xml里面的错误了;前面一篇文章已写过。即http://blog.csdn.net/caoxu1987728/archive/2008/07/12/2645004.aspx。不过当时就有错误,一直没检查出来,还以为是tomcat插件的原因,此时终于明白:tomcat插件于我只有好处,没有害处,不然要它干嘛,是不是啊错误源码如下:xml version="1

2008-08-02 22:19:00 1065 1

原创 html中标签的使用

看完下面代码将一目了然: 表头表头 第一行第1列第一行第2列 第二行第1列第二行第2列 换言之,为行 为列. 明白了吧,还不明白?!那再举简单的例子。 一列二行: 123123 123123 一行二列: 123123 123123 这

2008-08-02 20:05:00 638

原创 Servlet的url-pattern详解

Servlet的url匹配以及url-pattern详解     Servlet是J2EE开发中常用的技术,使用方便,配置简单,老少皆宜。估计大多数朋友都是直接配置用,也没有关心过具体的细节,今天遇到一个问题,上网查了servlet的规范才发现,servlet中的url-pattern还是有一些文章在里面的,总结了一些东西,放出来供大家参考,以免遇到问题又要浪费时间。    一,s

2008-08-02 12:34:00 9621 3

原创 罗列各种spider

Heritrix Heritrix is the Internet Archive′s open-source, extensible, web-scale, archival-quality web crawler project.Heritrix (sometimes spelled heretrix, or misspelled or missaid as heratrix/heri

2008-08-01 22:47:00 757

原创 技术人员最终的出路

一个刚毕业的大学生,从事销售和从事技术两种不同的工作,可能工资的差距会达到数倍之远。对于初出校园的人来说,不无一种极端的诱惑力。刚毕业的年轻人,当然会果断的选择技术之路。两年后,回头再看看,由于经验的积累,做业务的积累了部分客户资源,做技术的积累了好的经验,在各自的领域内都大展开了手脚,各自收入也基本接近了。再以后呢,技术之路越来越难走,毕竟做技术需要的大把的时间和大量的精力,否则就跟不上信息

2008-08-01 19:41:00 677

原创 关于args[]

 可能当年使用Doc命令时常用到。输入命令行:java  类名 参数1 参数2 参数3测试一下:public class test {    public static void main(String[] args)    {        System.out.println(args.length);    }}结果:3.而现今不要命令行,

2008-08-01 15:54:00 581

原创 Java之static关键字

 static表示“全局”或者“静态”的意思,用来修饰成员变量和成员方法,也可以形成静态static代码块。1、static成员被static修饰的成员变量和成员方法独立于该类的任何对象。  按照是否静态的对类成员变量进行分类可分两种:一种是被static修饰的变量,叫静态变量或类变量;另一种是没有被static修饰的变量,叫实例变量。两者的区别是:  对于静态变量在内存中只有一个拷贝(节

2008-08-01 14:30:00 955 1

tm-extractors-0.4

解析word文本的必需包

2008-05-01

googleapi.jar

googleapi.jar很好用的一个包

2008-05-01

jacob_1.11

虽然不是最新的版本,但很好用

2008-05-01

校园选址问题

一个数学建模的最简单的解答

2008-04-27

Lucene2.0+Heritrix(ch4源代码)

关于检索的源代码,仅供参考

2008-04-27

Lucene2.0+Heritrix(ch3源代码)

Lucene2.0+Heritrix(ch3源代码)

2008-04-23

Lucene2.0+Heritrix(源代码)

这是第一个搜索引擎的代码实例,大家看看

2008-04-21

系统垃圾清理

系统垃圾清理,简单好用

2008-04-20

lucene-core-2.0.0.jar

开发lucene的包之一

2008-04-15

je-analysis-1.4.0.jar

开发lucene的包之一

2008-04-15

jsp+css+javascript

此视频简单开发jsp+css+javascript的小程序

2008-04-13

导入包Mysql

此视频简单介绍了如何导入包

2008-04-13

ftp服务下载器

mini ftp服务器简单实用

2008-04-13

Mysql加载纯驱动程序

此文件放在JDK的\jre\lib\ext下

2008-04-13

注册模块(会员管理)

本实例简单介绍了MVC+mysql

2008-04-13

jsp大学使用教程

这里含有jsp大学实用教程里面的全部代码,还有ppt讲解

2008-04-13

计算三角形面积

此程序能够初识MVC,了解它的基本流程

2008-04-13

俄罗斯方块

本程序比较简单,适合看过初学者看

2008-04-05

俄罗斯方块

本程序算法要求比较高,但比较全面,适合看过其他俄罗斯方块的人看

2008-04-05

运动会分数统计

一个很不错的程序,供大家使用

2008-04-05

魔王语言解释

含有多个程序,供大家比较使用

2008-04-05

魔王语言解释

这是一份魔王语言解释报告

2008-04-05

校园导游咨询

含有两个不同算法的程序

2008-04-05

校园导游程序报告

这个是一个校园导游报告

2008-04-05

数制转换(数据结构)

数据结构课程内容,精彩多多

2007-11-08

ICTCLAS java分词接口

ICTCLAS 中文分词的elipse 工程

2008-11-15

Lucene+Nutch搜索引擎 光盘源码

1.光盘中所附代码的运行环境 操作系统Microsoft Windows 2000/XP及以上 服务器Tomcat 5.5版本 数据库SQL Server 2000以上版本 Java 支持环境JDK 1.6.0版本 2.本书所附光盘范例 代码安装说明:在Eclipse环境下直接选取“import->Existing Project”,导入希望调试的工程。为了测试方便,每个工程保持独立,能够独立编译和运行,部分工程需要引入Lucene相应的Jar包支持。 光盘内文件列表说明: Eclipse工程/LuceneChapter1 说明:本书第一章Eclipse工程文件,测试编程环境的源代码。 文件列表: HelloEclipse.java // Eclipse测试代码 Eclipse工程/LuceneChapter2 说明:本书第二章Eclipse工程文件,搜索引擎原理简单实现的源代码。 文件列表: infoItem.java // infoItem结构 WebCrawler.java // 自己编写的WebCrawler示例代码 WebHttpClient.java // 自己编写的WebHttpClient示例代码 WebParamCrawler.java // 自己编写的WebParamCrawler示例代码 WebParser.java // 自己编写的网页解析WebParser代码 WebParserFilter.java // 网页解析过滤WebParserFilter代码 WordIndex.java // 索引测试WordIndex代码 Eclipse工程/LuceneChapter3 说明:本书第三章Eclipse工程文件,搜索引擎Lucene Demo实现的源代码。 文件列表: CreateIndex.java // 使用Lucene创建索引Demo代码 DemoTest.java // Lucene测试代码 LuceneSearch.java // Lucene检索测试代码 Eclipse工程/LuceneChapter4 说明:本书第四章测试文件,测试网站examweb页面以及下载列表; 文件列表: multiurls.txt // Nutch下载的Url列表 index.htm // 测试网站网页 more.htm // 测试网站网页 music.htm // 测试网站网页 stillmore.htm // 测试网站网页 zqzs.htm // 测试网站网页 Eclipse工程/LuceneChapter5 说明:本书第五章Eclipse工程文件,搜索引擎Lucene 索引实现和测试的源代码。 文件列表: LuceneIndexDatabase.java // 使用Lucene创建数据库数据索引 LuceneIndexDelete.java // 索引内容删除代码 LuceneIndexDeleteId.java // 按照文档ID删除索引文件代码 LuceneIndexDeleteOptimize.java // 删除后文档编号压缩实例代码 LuceneIndexInteger.java // 数字类型索引代码 LuceneIndexList.java // 索引实例 LuceneIndexLocalDisk.java // 本地磁盘纯文本文件索引 LuceneIndexManager.java // 索引管理实例 LuceneIndexNumber.java // 数字类型数据索引 LuceneIndexParam.java // 索引参数测试 LuceneIndexText.java // 索引纯文本文档 LuceneIndexTypes.java // 索引类型实例 LuceneIndexUnsearch.java // 索引实例实例代码 LuceneIndexUpdate.java // 索引更新实例代码 Eclipse工程/LuceneChapter6 说明:本书第六章Eclipse工程文件,搜索引擎Lucene检索实现的源代码。 文件列表: LuceneRAMSearchText.java // 使用内存索引的代码 LuceneSearchQueryType.java // 各种检索类型演示代码 LuceneSearchSpanQuery.java // SpanQuery检索演示代码 LuceneSearchText.java // 对文本索引检索实例代码 Eclipse工程/LuceneChapter7 说明:本书第七章Eclipse工程文件,搜索引擎查询器实现的源代码。 文件列表: BoostChangeQuery.java // Boost参数的演示实例 BoostFieldQuery.java // 修改文档域Boost参数的检索实例 BoostQuery.java // 修改文档Boost参数的检索实例 LuceneSortExplain.java // 检索评分参数输出测试代码 SortByField.java // 按域排序代码 SortByFieldInverse.java // 检索结果逆向排序代码 SortByMultiFields.java // 多域索引代码 SortDocID.java // 按照文档编号索引 SortExtendSearch.java // 自定义排序扩展检索代码 SortExtendTest.java // 排序扩展测试代码 SortRelavence.java // 排序调整代码 Eclipse工程/LuceneChapter8 说明:本书第八章Eclipse工程文件,搜索引擎分析器实现的源代码。 文件列表: ChineseAnalyzer.java // ChineseAnalyzer代码 ChineseFilter.java // ChineseAnalyzer依赖的过滤器 ChineseTokenizer.java // ChineseAnalyzer依赖的分词器 CJKAnalyzer.java // 使用CJKAnalyzer进行中文分析 CJKTokenizer.java // CJKAnalyzer依赖的内部类 ICTCLASAnalyzer.java // 使用ICTCLASAnalyzer进行中文分析 LuceneChineseAnalyzerText.java //使用ChineseAnalyzer进行中文分析代码 LuceneCJKAnalyzerText.java //使用CJKAnalyzer进行中文分析代码 LuceneDefaultAnalyzerText.java // 默认分析器索引代码 LuceneIKAnalyzerText.java // 使用IKAnalyzer进行中文分析代码 LuceneJEAnalyzerText.java // 使用JEAnalyzer进行中文分析代码 LuceneKeywordAnalyzerText.java // 使用KeywordAnalyzer进行分析 LuceneMIKAnalyzerText.java // 使用MIKAnalyzer进行中文分析代码 LuceneSearchAnalyzer.java // SearchAnalyzer演示代码 LuceneSimpleAnalyzerText.java // SimpleAnalyzer分析演示代码 LuceneStandardAnalyzerText.java // StandardAnalyzer分析演示代码 LuceneStopAnalyzerText.java // StopAnalyzer分析演示代码 LuceneWhitespaceAnalyzerText.java // WhitespaceAnalyzer分析演示代码 Eclipse工程/LuceneChapter9 说明:本书第九章Eclipse工程文件,搜索引擎分析器实现和测试的源代码。 文件列表: ChineseAnalyzer.java // 中文分词演示代码代码 ChineseFilter.java // 一个内部依赖文件中文过滤器代码 ChineseTokenizer.java // 一个内部依赖文件中文切分器代码 DataBaseTool.java // 数据库基础工具代码代码 HtmlParserExtraction.java // HtmlParser提取HTML文件内容代码 HtmlParserGetBaiduUrls.java // HtmlParser获取检索结果页链接代码 HtmlParserGetLexerUrls.java // HtmlParser中使用Lexer获取链接代码 HtmlParserGetPageUrls.java // 获取网页所有链接代码 iTextPDFExtractor.java // 使用iText解析PDF文档代码 PDFBoxHello.java // PDFBox测试代码 PDFBoxLuceneIndex.java // PDFBox创建PDF文件的Lucene索引 PDFBoxPathIndex.java // PDFBox创建指定目录PDF文档索引 POIOfficeExtractor.java // POI处理Excel和Word文档代码 ResultBean.java // 结果集管理类 XercesXMLExtractor.java // 使用Xerces的XML解析 XMLExtractor.java // XML文件内容解析 Eclipse工程/LuceneChapter10 说明:本书第十章Eclipse工程文件,搜索引擎的源代码。 文件列表: MultiSocketClient.java // 多客户端程序 SockClient.java // Socket通信客户端 SockServer.java // Socket通信服务器 SockServer2.java // 带检索功能的Socket通信服务器 DistributedSearch.java // Nutch分布式检索代码 DistributedSearchTest.java // Nutch分布式检索测试代码 Eclipse工程/LuceneChapter11 说明:本书第十一章Eclipse工程文件,Nutch专题搜索引擎实例的源代码。 文件列表: createkeywordstable.sql // 关键词配置数据库 DataBaseTool.java // 数据库运行参数访问工具 RadarSpecialSearchEngine.java // 信息监控搜索 index.jsp // Web首页 resultprocess.jsp // 检索结果处理Web页面 search.jsp // 检索调用结果Web页面 Eclipse工程/LuceneChapter12 说明:本书第十二章Eclipse工程文件,Lucene实现企业搜索实例的源代码。 文件列表: BNVConfig.xml // 系统运行参数配置文件 ConfigClassify.java // 配置文件解析参数组管理 ConfigField.java // 配置文件域访问类 ConfigManager.java // 配置文件管理,组织参数文件 create_luceneinfo.sql // 实例数据库创建脚本 databaseTool.java // 复杂的数据库访问工具 datatool.java // 数据库访问工具 EBNVIndex.java // 负责索引的总体控制和调用 FileDocument.java // 文档类 FileManager.java // 负责文件和内容管理 LuceneIndexLocalDisk.java // 负责本地文档解析加载和索引 SearchResultBean.java // 负责组织检索结果 SearchTool.java // Lucene内容检索类 XMLExtractor.java // XML文档解析类 results.jsp // 搜索web页面

2008-11-10

开发自己的搜索引擎

这是在没有tomcat插件下的搜索引擎实例源码

2008-08-02

java 编程思想doc

java 编程思想可供初学者学习java的基本语法

2008-07-24

javascript全程指南

内容比较全面,不过是网页,需要查找源文件

2008-07-24

搜索引擎技术培训

搜索引擎技术培训的了解

2008-07-24

搜索引擎简介

基本上介绍了搜索引擎的各个方面

2008-07-24

tomcatpluginv3

服务器插件,对web应用很有用

2008-05-11

htmlparser1.6

学习抓取网页的一个必要包

2008-05-11

lucene in action 源代码

lucene in action 源代码

2008-04-28

xpdf-3.02pl2-win32.zip

xpdf-3.02pl2-win32.zip有用的类吧

2008-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除