网络爬虫
课程笔记
青岛City
该知道的都知道了,不知道的慢慢了解~
展开
-
jsoup库简单查询笔记
jsoup库学习笔记一、输入1.1 从字符串中分析文档1.2 解析一个body片段1.3 从URL加载一个Document1.4 从一个文件加载一个文档jsoup用来解析html文档一、输入1.1 从字符串中分析文档使用静态方法,或者如果页面来自 Web,并且您希望获取绝对 URL。parse(String html, String baseUri)该方法能将输入的HTML解析为一个新的文档。参数baseUrl用来将相对URL转化为绝对URL,并指定从那个网站获取文档。1.2 解析一个bod原创 2020-11-11 20:20:19 · 261 阅读 · 0 评论 -
解析网易的新闻内容(基于jsoup库)
实验一 解析网易的新闻内容(jsoup)一、 实验目的了解网络爬虫练习jsoup库的使用二、 实验内容利用jsoup库模拟浏览器获取并处理网页中的html元素标签。2.1 了解网络爬虫与jsoup库jsoup的中文官方手册:https://www.open-open.com/jsoup/了解connnect方法的使用:2.2 查看网页结构2.3 模拟浏览器请求获取数据Document document = Jsoup.connect(“http://dy.163.com/a原创 2020-11-09 10:31:46 · 573 阅读 · 3 评论