【实例简介】
包括知识介绍和最全面的网络爬虫源代码,分开讲解,更加细致入微,非常好的代码,很实用
【实例截图】
【核心代码】
AutoCrawling
└── AutoCrawling
├── autocrawling_example.properties
├── autocrawling_system.properties
├── bin
│ ├── autocrawling_http_parser.properties
│ ├── com
│ │ └── cn
│ │ └── simepu
│ │ └── auto
│ │ └── crawling
│ │ ├── config
│ │ │ ├── SystemConfig.class
│ │ │ └── ThreadPoolConfig.class
│ │ ├── db
│ │ │ └── DBHelper.class
│ │ ├── main
│ │ │ ├── MainClass.class
│ │ │ └── ProgramEntry.class
│ │ ├── thread
│ │ │ ├── MyThread.class
│ │ │ ├── MyThreadPool.class
│ │ │ └── MyThreadPoolControl.class
│ │ └── util
│ │ ├── BloomFilter.class
│ │ ├── FileManager.class
│ │ ├── Tools.class
│ │ └── UrlExtractor.class
│ └── log4j.xml
├── crawl.log
├── lib
│ ├── jocky-ant.jar
│ ├── jocky.jar
│ ├── log4j-1.2.9.jar
│ └── sqljdbc.jar
└── src
├── autocrawling_http_parser.properties
├── com
│ └── cn
│ └── simepu
│ └── auto
│ └── crawling
│ ├── config
│ │ ├── SystemConfig.java
│ │ └── ThreadPoolConfig.java
│ ├── db
│ │ └── DBHelper.java
│ ├── main
│ │ ├── MainClass.java
│ │ └── ProgramEntry.java
│ ├── thread
│ │ ├── MyThread.java
│ │ ├── MyThreadPoolControl.java
│ │ └── MyThreadPool.java
│ └── util
│ ├── BloomFilter.java
│ ├── FileManager.java
│ ├── Tools.java
│ └── UrlExtractor.java
└── log4j.xml
24 directories, 35 files