在这里我们用jsoup来做,首先导入jsoup依赖
直接引入下面的依赖,如果有喜欢追新版本的强迫症者可以到官网搜索最新版本https://mvnrepository.com/
<!-- jsoup -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.12.1</version>
</dependency>
接下来就是开始小demo的制作,首先创建一个类,这个随意,在这里演示的是爬取大乐透的开奖信息,
这里我们通过类选择器来获取元素,废话不多说,直接上代码。
import com.demo.entity.dto.LotteryInfo;
import org.apache.commons.lang3.StringUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.UUID;
public class Lottery {
//定义访问的链接
public static String URL = "http://kaijiang.500.com/shtml/dlt/";
public static String url_html = ".shtml";
public Document getHtmlTextByUrl(){
String url = URL + getQS() + url_html;
Document document = null;
try {
//通过Jsoup访问链接获