org.jsoup
jsoup
${latest.version}
代码并不多,通过URL地址获取HTML文本内容,并进行解析。
public class JsoupTest {
public static void main(String[] args) throws IOException {
// 要爬取的网址url链接列表
List list = new ArrayList<>();
for (int i = 0; i <= 225; i += 25) {
String url = “https://movie.douban.com/top250?start=” + i + “&filter=”;
list.add(url);
}
// 遍历url列表,爬取网页数据
for (String urlStr : list) {
Document doc = Jsoup.connect(urlStr)
.maxBodySize(Integer.MAX_VALUE)
.userAgent(“Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36”)
.timeout(6000)
.get();
Element content = doc.getElementById(“content”);
Elements infos = content.getElementsByClass(“info”);
for (Element element : infos) {
总结:绘上一张Kakfa架构思维大纲脑图(xmind)
其实关于Kafka,能问的问题实在是太多了,扒了几天,最终筛选出44问:基础篇17问、进阶篇15问、高级篇12问,个个直戳痛点,不知道如果你不着急看答案,又能答出几个呢?
若是对Kafka的知识还回忆不起来,不妨先看我手绘的知识总结脑图(xmind不能上传,文章里用的是图片版)进行整体架构的梳理
梳理了知识,刷完了面试,如若你还想进一步的深入学习解读kafka以及源码,那么接下来的这份《手写“kafka”》将会是个不错的选择。
-
Kafka入门
-
为什么选择Kafka
-
Kafka的安装、管理和配置
-
Kafka的集群
-
第一个Kafka程序
-
Kafka的生产者
-
Kafka的消费者
-
深入理解Kafka
-
可靠的数据传递
-
Spring和Kafka的整合
-
SpringBoot和Kafka的整合
-
Kafka实战之削峰填谷
-
数据管道和流式处理(了解即可)
削峰填谷
- 数据管道和流式处理(了解即可)
[外链图片转存中…(img-EzpJOwdO-1714379159674)]
[外链图片转存中…(img-VJKlzfuQ-1714379159674)]