一. jsoup介绍
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
二. jsoup功能
- 从一个URL,文件或字符串中解析HTML;
- 使用DOM或CSS选择器来查找、取出数据;
- 可操作HTML元素、属性、 文本;
三. 爬取数据步骤
1.创建一个Java项目。
2.去Jsoup官网下载Jsoup的jar包,导入到项目中。
3.在浏览器登录校园招聘网站,搜索大数据岗位,获取网址和网页源码
4.编写Java代码
package jsoup;
import java.io.BufferedReader;
import java.io.IOException;
impo