![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
java
文章平均质量分 61
世界好演员
为搬砖而生
展开
-
java实现简单爬虫
JSOUP介绍 Jsoup是一个Java的Html解析引擎,并且可直接访问远程url地址,并且可通过各种类型的选择器进行dom节点的筛选,因此我们可以尝试用Jsoup实现一个简单的爬虫程序,以下以某一图片网站为例,模拟进行图片的爬取。 本文仅用于学习交流。 准备 首先找到一个准备爬取的网站,获取起网站根路径,作为BASE_URL: 网络协议 protocol:https: 路径url BASE_URL:${protocol}//xxx.xxx.com/ 页面结构如下: 在此页面,我们要获取的内容包含两部原创 2021-12-21 15:15:49 · 1095 阅读 · 0 评论 -
ES 附件搜索
ES实现附件搜索方式: 1、基于attachment pipeline插件 插件下载地址: 版本根据自己需求改动 https://artifacts.elastic.co/downloads/elasticsearch-plugins/ingest-attachment/ingest-attachment-5.6.9.zip ① 建立附件解析pipeline /_ingest/pipeline/a...原创 2020-04-30 14:12:38 · 971 阅读 · 0 评论