Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址,也可以只处理解析html代码。
作为Java程序员最常用的爬虫工具,太多内容就不介绍了,以下3个网站可以满足所有需求。
官方网站 https://jsoup.org/
中文API教程 http://www.open-open.com/jsoup/
抓包工具
1. chrome
2. charles 需要安装https证书并且授权
博主常年看起点,每月开销大概200-300,很多小说就是打发时间的,博主并不想付钱,只好看盗版,可是盗版广告很多,烦不胜烦,包含的功能比如背景色啊,字体字号啊,又不能完全命中博主挑剔的需求,只好出此下策。
1. 选中一个网站,博主找到一个小说数据比较全的网站
2. 由于这个网站是https的,所以需要做证书授权,在main方法的第一步,