java实现网页搜索引擎_java实现搜索引擎代码+页面爬虫

【实例简介】

java实现搜索引擎代码+页面爬虫 也是网上找的,分享下赚点分,顺便说下写的不错!

【实例截图】

【核心代码】

230c79c0-5bbb-41d7-aff7-9f52d486fc64

└── 搜索引擎代码+页面爬虫

└── test

├── build

│   └── classes

│   ├── ceshi

│   │   └── Test.class

│   ├── configure

│   │   └── Configuration.class

│   ├── configure.properties

│   ├── core

│   │   ├── preprocess

│   │   │   ├── DictReader.class

│   │   │   ├── DictSegment.class

│   │   │   ├── forwardIndex

│   │   │   │   └── ForwardIndex.class

│   │   │   ├── index

│   │   │   │   ├── originalPageGetter.class

│   │   │   │   └── RawsAnalyzer.class

│   │   │   └── invertedIndex

│   │   │   └── InvertedIndex.class

│   │   ├── query

│   │   │   └── Response.class

│   │   ├── spider

│   │   │   ├── Dispatcher.class

│   │   │   ├── Gather.class

│   │   │   ├── Spider.class

│   │   │   ├── URLClient.class

│   │   │   └── WebAnalyzer.class

│   │   └── util

│   │   ├── DBConnection.class

│   │   ├── HtmlParser.class

│   │   ├── MD5.class

│   │   ├── Page.class

│   │   ├── Result.class

│   │   ├── ResultGenerator.class

│   │   └── StopWordsMerger.class

│   ├── Dictionary

│   │   ├── stopWord.txt

│   │   └── wordlist.txt

│   ├── mysql-connector-java-5.1.7-bin.jar

│   ├── Raws

│   │   ├── RAW__0.txt

│   │   ├── RAW__1.txt

│   │   ├── RAW__2.txt

│   │   ├── RAW__3.txt

│   │   └── RAW__4.txt

│   └── test

│   ├── testDBConnection.class

│   ├── testDictSegment.class

│   ├── testMySql.class

│   ├── testOffset.class

│   ├── testParseHtml.class

│   ├── testRawsAnalyzer.class

│   ├── testSougouOffset.class

│   ├── testStringTokenizer.class

│   ├── testSubFile.class

│   └── testSubString.class

├── src

│   ├── ceshi

│   │   └── Test.java

│   ├── configure

│   │   └── Configuration.java

│   ├── configure.properties

│   ├── core

│   │   ├── preprocess

│   │   │   ├── DictReader.java

│   │   │   ├── DictSegment.java

│   │   │   ├── forwardIndex

│   │   │   │   └── ForwardIndex.java

│   │   │   ├── index

│   │   │   │   ├── originalPageGetter.java

│   │   │   │   └── RawsAnalyzer.java

│   │   │   └── invertedIndex

│   │   │   └── InvertedIndex.java

│   │   ├── query

│   │   │   └── Response.java

│   │   ├── spider

│   │   │   ├── Dispatcher.java

│   │   │   ├── Gather.java

│   │   │   ├── Spider.java

│   │   │   ├── URLClient.java

│   │   │   └── WebAnalyzer.java

│   │   └── util

│   │   ├── DBConnection.java

│   │   ├── HtmlParser.java

│   │   ├── MD5.java

│   │   ├── Page.java

│   │   ├── ResultGenerator.java

│   │   ├── Result.java

│   │   └── StopWordsMerger.java

│   ├── Dictionary

│   │   ├── stopWord.txt

│   │   └── wordlist.txt

│   ├── lib

│   │   └── mysql-connector-java-5.1.7-bin.jar

│   ├── Raws

│   │   ├── RAW__0.txt

│   │   ├── RAW__1.txt

│   │   ├── RAW__2.txt

│   │   ├── RAW__3.txt

│   │   └── RAW__4.txt

│   └── test

│   ├── testDBConnection.java

│   ├── testDictSegment.java

│   ├── testMySql.java

│   ├── testOffset.java

│   ├── testParseHtml.java

│   ├── testRawsAnalyzer.java

│   ├── testSougouOffset.java

│   ├── testStringTokenizer.java

│   ├── testSubFile.java

│   └── testSubString.java

└── WebContent

├── dySE-logo.jpg

├── index.jsp

├── META-INF

│   └── MANIFEST.MF

├── NewFile.html

├── search.jsp

├── Thumbs.db

└── WEB-INF

├── classes

│   ├── configure

│   │   └── Configuration.class

│   ├── configure.properties

│   ├── core

│   │   ├── preprocess

│   │   │   ├── DictReader.class

│   │   │   ├── DictSegment.class

│   │   │   ├── forwardIndex

│   │   │   │   └── ForwardIndex.class

│   │   │   ├── index

│   │   │   │   ├── originalPageGetter.class

│   │   │   │   └── RawsAnalyzer.class

│   │   │   └── invertedIndex

│   │   │   └── InvertedIndex.class

│   │   ├── query

│   │   │   └── Response.class

│   │   ├── spider

│   │   │   ├── Dispatcher.class

│   │   │   ├── Gather.class

│   │   │   ├── Spider.class

│   │   │   ├── URLClient.class

│   │   │   └── WebAnalyzer.class

│   │   └── util

│   │   ├── DBConnection.class

│   │   ├── HtmlParser.class

│   │   ├── MD5.class

│   │   ├── Page.class

│   │   ├── Result.class

│   │   ├── ResultGenerator.class

│   │   └── StopWordsMerger.class

│   └── test

│   ├── testDBConnection.class

│   ├── testDictSegment.class

│   ├── testMySql.class

│   ├── testOffset.class

│   ├── testParseHtml.class

│   ├── testRawsAnalyzer.class

│   ├── testSougouOffset.class

│   ├── testStringTokenizer.class

│   ├── testSubFile.class

│   └── testSubString.class

└── web.xml

46 directories, 118 files

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值