import org.apache.http.client.HttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.HttpResponse;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) throws Exception {
HttpClient httpClient = HttpClients.createDefault();
HttpGet request = new HttpGet("http://example.com"); // 替换为实际网页地址
// 发送请求并获取响应
HttpResponse response = httpClient.execute(request);
String htmlContent = EntityUtils.toString(response.getEntity());
// 使用Jsoup解析HTML内容
Document doc = Jsoup.parse(htmlContent);
// 提取第一个tab页的表格数据
Element tab1Table = doc.selectFirst("#tab1 table");
// 提取第二个tab页的表格数据
Element tab2Table = doc.selectFirst("#tab2 table");
// 提取第三个tab页的表格数据
Element tab3Table = doc.selectFirst("#tab3 table");
// 假设我们要对比表格中第一行第一列的数据
String data1 = tab1Table.select("tr").get(0).select("td").get(0).text();
String data2 = tab2Table.select("tr").get(0).select("td").get(0).text();
String data3 = tab3Table.select("tr").get(0).select("td").get(0).text();
// 对比数据
if (data1.equals(data2) && data2.equals(data3)) {
System.out.println("三个表格中的数据相同");
} else {
System.out.println("三个表格中的数据不同");
}
}
}
当httpentity entity = builder.build()且entity本身是UIT-8,但是bodyparts里面携带的参数是iso-8559-1,导致中文变成问号的编码问题
byte[] iso88591Data = ... // 从bodyParts中获取ISO 8859-1编码的数据
// 将ISO 8859-1编码的数据转换为UTF-8编码
String utf8Data = new String(iso88591Data, StandardCharsets.ISO_8859_1);
// 使用UTF-8字符集构建StringEntity
HttpEntity entity = new StringEntity(utf8Data, ContentType.create("text/plain", "UTF-8"));