【实例简介】
经过测试,可以抓取一个完整的网站,包括网站的图片、css、js等。同时根据网站目录,在本地生成相同目录。使用Jsoup+Java。下载之后,可以直接运行。
【实例截图】
【核心代码】
haha
└── haha
├── README.md
├── classes
│ └── artifacts
│ └── haha_war_exploded
│ └── META-INF
│ └── MANIFEST.MF
├── haha.iml
├── pom.xml
├── src
│ └── main
│ ├── java
│ │ └── cn
│ │ └── yuping
│ │ └── haha
│ │ ├── CrawlWebSite.java
│ │ └── util
│ │ ├── FileUtils.java
│ │ └── StringUtil.java
│ ├── resources
│ │ ├── image
│ │ │ └── 1.jpg
│ │ └── simhei.ttf
│ └── webapp
│ ├── WEB-INF
│ │ └── web.xml
│ └── index.jsp
└── target
├── classes
│ ├── cn
│ │ ├── dongqihong
│ │ │ └── hehe
│ │ │ ├── HttpRequestUtil.class
│ │ │ ├── ImgFontByte.class
│ │ │ ├── Index.class
│ │ │ ├── JsapiTicketCreater.class
│ │ │ └── Sign.class
│ │ └── yuping
│ │ └── haha
│ │ ├── CrawlWebSite.class
│ │ └── util
│ │ ├── FileUtils.class
│ │ └── StringUtil.class
│ ├── image
│ │ └── 1.jpg
│ └── simhei.ttf
├── haha
│ ├── META-INF
│ │ └── MANIFEST.MF
│ ├── WEB-INF
│ │ ├── classes
│ │ │ ├── cn
│ │ │ │ ├── dongqihong
│ │ │ │ │ └── hehe
│ │ │ │ │ ├── HttpRequestUtil.class
│ │ │ │ │ ├── ImgFontByte.class
│ │ │ │ │ ├── Index.class
│ │ │ │ │ ├── JsapiTicketCreater.class
│ │ │ │ │ └── Sign.class
│ │ │ │ └── yuping
│ │ │ │ └── haha
│ │ │ │ ├── CrawlWebSite.class
│ │ │ │ └── util
│ │ │ │ ├── FileUtils.class
│ │ │ │ └── StringUtil.class
│ │ │ ├── image
│ │ │ │ └── 1.jpg
│ │ │ └── simhei.ttf
│ │ ├── lib
│ │ │ ├── fastjson-1.2.12.jar
│ │ │ ├── javax.servlet-api-3.1.0.jar
│ │ │ └── jsoup-1.8.3.jar
│ │ └── web.xml
│ └── index.jsp
└── hehe
├── META-INF
│ └── MANIFEST.MF
├── WEB-INF
│ ├── classes
│ │ ├── cn
│ │ │ └── dongqihong
│ │ │ └── hehe
│ │ │ ├── HttpRequestUtil.class
│ │ │ ├── ImgFontByte.class
│ │ │ ├── Index.class
│ │ │ ├── JsapiTicketCreater.class
│ │ │ └── Sign.class
│ │ ├── image
│ │ │ └── 1.jpg
│ │ └── simhei.ttf
│ ├── image
│ │ └── 1.jpg
│ ├── lib
│ │ ├── fastjson-1.2.12.jar
│ │ └── javax.servlet-api-3.1.0.jar
│ └── web.xml
├── bg.jpg
├── hz
│ ├── css
│ │ ├── active.css
│ │ ├── animate.min.css
│ │ └── main.css
│ ├── img
│ │ ├── ThinkPad.jpg
│ │ ├── banner1.jpg
│ │ ├── sagj
│ │ │ └── img1.jpg
│ │ └── sagj.jpg
│ ├── index.html
│ ├── js
│ │ ├── autoSize.js
│ │ ├── swiper.min.js
│ │ ├── touch.js
│ │ └── zepto.min.js
│ └── sagj.html
├── ico.png
├── index.css
├── index.jsp
├── index_delete.html
├── invite.jsp
└── logo.png
52 directories, 69 files