爬虫入门
DFGOMC
爱编码,爱探索
展开
-
爬虫入门案例
java爬虫入门案例 本博客只供学习,搜索手机。 1.sql脚本 DROP TABLE IF EXISTS `jb_item`; CREATE TABLE `jb_item` ( `id` bigint(10) NOT NULL AUTO_INCREMENT COMMENT '主键id', `spu` bigint(15) NULL DEFAULT NULL COMMENT '商品集合id', `sku` bigint(15) NULL DEFAULT NULL COMMENT '商品最原创 2020-07-29 00:29:11 · 159 阅读 · 0 评论 -
Jsoup
Jsoup Jsoup是一款java的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 jsoup主要功能 从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找,取出数据; 可操作HTML元素、属性、文本; 入门程序 解析url 1.导入依赖 <!-- jsoup --> <dependency> <groupId>o原创 2020-07-27 20:08:59 · 112 阅读 · 0 评论 -
HttpClient
HttpClient 1.pom.xml依赖 <!-- 自动爬取 --> <dependency> <groupId>org.apache.httpcomponents</groupId> <artifactId>httpclient</artifactId> <version>4.5.12</version> </dependency> <!-- 日志 -->原创 2020-07-27 20:07:31 · 128 阅读 · 0 评论