jsoup抓取html中的js,使用Jsoup,抓取整个网站(包括图片、js、css)

【实例简介】

经过测试,可以抓取一个完整的网站,包括网站的图片、css、js等。同时根据网站目录,在本地生成相同目录。使用Jsoup+Java。下载之后,可以直接运行。

【实例截图】

【核心代码】

haha

└── haha

├── README.md

├── classes

│   └── artifacts

│   └── haha_war_exploded

│   └── META-INF

│   └── MANIFEST.MF

├── haha.iml

├── pom.xml

├── src

│   └── main

│   ├── java

│   │   └── cn

│   │   └── yuping

│   │   └── haha

│   │   ├── CrawlWebSite.java

│   │   └── util

│   │   ├── FileUtils.java

│   │   └── StringUtil.java

│   ├── resources

│   │   ├── image

│   │   │   └── 1.jpg

│   │   └── simhei.ttf

│   └── webapp

│   ├── WEB-INF

│   │   └── web.xml

│   └── index.jsp

└── target

├── classes

│   ├── cn

│   │   ├── dongqihong

│   │   │   └── hehe

│   │   │   ├── HttpRequestUtil.class

│   │   │   ├── ImgFontByte.class

│   │   │   ├── Index.class

│   │   │   ├── JsapiTicketCreater.class

│   │   │   └── Sign.class

│   │   └── yuping

│   │   └── haha

│   │   ├── CrawlWebSite.class

│   │   └── util

│   │   ├── FileUtils.class

│   │   └── StringUtil.class

│   ├── image

│   │   └── 1.jpg

│   └── simhei.ttf

├── haha

│   ├── META-INF

│   │   └── MANIFEST.MF

│   ├── WEB-INF

│   │   ├── classes

│   │   │   ├── cn

│   │   │   │   ├── dongqihong

│   │   │   │   │   └── hehe

│   │   │   │   │   ├── HttpRequestUtil.class

│   │   │   │   │   ├── ImgFontByte.class

│   │   │   │   │   ├── Index.class

│   │   │   │   │   ├── JsapiTicketCreater.class

│   │   │   │   │   └── Sign.class

│   │   │   │   └── yuping

│   │   │   │   └── haha

│   │   │   │   ├── CrawlWebSite.class

│   │   │   │   └── util

│   │   │   │   ├── FileUtils.class

│   │   │   │   └── StringUtil.class

│   │   │   ├── image

│   │   │   │   └── 1.jpg

│   │   │   └── simhei.ttf

│   │   ├── lib

│   │   │   ├── fastjson-1.2.12.jar

│   │   │   ├── javax.servlet-api-3.1.0.jar

│   │   │   └── jsoup-1.8.3.jar

│   │   └── web.xml

│   └── index.jsp

└── hehe

├── META-INF

│   └── MANIFEST.MF

├── WEB-INF

│   ├── classes

│   │   ├── cn

│   │   │   └── dongqihong

│   │   │   └── hehe

│   │   │   ├── HttpRequestUtil.class

│   │   │   ├── ImgFontByte.class

│   │   │   ├── Index.class

│   │   │   ├── JsapiTicketCreater.class

│   │   │   └── Sign.class

│   │   ├── image

│   │   │   └── 1.jpg

│   │   └── simhei.ttf

│   ├── image

│   │   └── 1.jpg

│   ├── lib

│   │   ├── fastjson-1.2.12.jar

│   │   └── javax.servlet-api-3.1.0.jar

│   └── web.xml

├── bg.jpg

├── hz

│   ├── css

│   │   ├── active.css

│   │   ├── animate.min.css

│   │   └── main.css

│   ├── img

│   │   ├── ThinkPad.jpg

│   │   ├── banner1.jpg

│   │   ├── sagj

│   │   │   └── img1.jpg

│   │   └── sagj.jpg

│   ├── index.html

│   ├── js

│   │   ├── autoSize.js

│   │   ├── swiper.min.js

│   │   ├── touch.js

│   │   └── zepto.min.js

│   └── sagj.html

├── ico.png

├── index.css

├── index.jsp

├── index_delete.html

├── invite.jsp

└── logo.png

52 directories, 69 files

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值