网络爬虫
文章平均质量分 91
律二萌萌哒
今天不学习,明天变垃圾
展开
-
网络爬虫页面解析 (Jsoup)
Jsoup我们抓取到页面之后,还需要对页面进行解析。可以使用字符串处理工具解析页面,也可以使用正则表达式,但是这些方法都会带来很大的开发成本,所以我们需要使用一款专门解析html页面的技术。1. jsoup介绍jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。jsoup的主要功能如下: 1.从一个URL,文件或字符串中解析HTML; 2.使用DO原创 2021-07-17 19:20:46 · 433 阅读 · 1 评论 -
网络爬虫小白教程 (HttpClient)
1.学习计划入门程序网络爬虫介绍HttpClient抓取数据Jsoup解析数据爬虫案例2.网络爬虫网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本2.1 爬虫入门程序2.1.1 环境准备JDK1.8IntelliJ IDEAIDEA自带的Maven2.1.2 环境准备创建Maven工程itcast-crawler-first并给pom.xml加入依赖 <dependencies> <!--.原创 2021-07-11 18:59:02 · 633 阅读 · 2 评论