- 博客(4)
- 资源 (28)
- 收藏
- 关注
原创 Java爬虫(五)--数据修改
主要解决的问题:1、在你解析一个Document之后可能想修改其中的某些属性值,然后再保存到磁盘或都输出到前台页面。2、你需要一个元素中的HTML内容。3、你需要修改一个HTML文档中的文本内容。
2017-08-28 17:26:06 804
原创 Java爬虫(三)--数据抽取
1、当你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构,应该怎么获取html数据?2、当你想使用类似于CSS或jQuery的语法来查找和操作元素,应该怎么做?3、当在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据,应该怎么做?
2017-08-28 17:14:18 2003 1
原创 Java爬虫(二)--解析一个HTML字符串
使用Jsoup的静态方法 Jsoup.parse(String html) 把 html 字符串解析为一个新的 Documnet 文档,然后通过使用 Document 中的方法或者它父类 Element 和 Node 中的方法取得相关的数据。
2017-08-28 10:26:00 1594
原创 Java爬虫(一)--工程的构建
一、新建项目通过 http://start.spring.io/ 构建简单的 Spring Boot 工程。 二、把工程导入 eclipse 后,在 pom.xml 中添加相关的 maven 依赖1、Jsoup 依赖2、由于需要用到 http 请求访问对应的页面,所以需要引入 httpclient 依赖。<!-- Jsoup --><dependency> <groupId>o
2017-08-28 10:22:53 369
Jetson AGX Xavier - Jetpack 4.6 的 paddlepaddle v2.2.2 安装包
2022-02-22
最新全国行政区划大全
2018-08-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人