自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 自学Java网络爬虫-Day2

自学Java网络爬虫-Day2 文章目录自学Java网络爬虫-Day2Jsoup1.Jsoup介绍2.加入依赖3.第一个Test(解析url)4.第二个Test(解析字符串)5.第三个Test(解析文件)6.第四个Test(使用dom方式遍历文档)7.第五个Test(使用选择器语)8.第六个Test(Selector选择器概述)9.第七个Test(Selector选择器组合使用) 第一天主要介绍的是HttpClient的相关内容,它的作用是来抓取页面。但是抓取之后必须进行解析才能获得我们想要的信息,今天学

2021-02-22 18:44:33 148

原创 自学Java网络爬虫-Day1

自学Java网络爬虫-Day1 网络爬虫 网络爬虫(web crawler)是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 从功能上来讲,爬虫分为采集、处理、储存。从一个或若干初始网页URL开始,不断抽取新的URL放入队列,直到满足停止条件。 学习网络爬虫的原因: 实现私人搜索引擎。 获取更多数据源。进行大数据分析或数据挖掘时,从数据统计网站或文献资料获取很难满足需求。 进行搜索引擎优化(SEO)。 利于就业。 入门程序 1. 环境准备 JDK1.8 IntelliJ IDEA 配置好的

2021-02-10 22:50:47 728 6

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除