爬虫
文章平均质量分 64
清雨未尽时
清雨入清晨,午时未阳依。
百望夕阳暮,如梦未尽时。
展开
-
Webgic的使用简单实例
相比前两天使用的其他网络爬虫工具,Webgic 框架更加灵活,使用更加方便,支持多种解析方式,纠错能力更强。废话不多说,心得全在代码中,说多以后自己看起来也费劲。1.添加依赖<dependency> <groupId>us.codecraft</groupId> <artifactId>webmagic-core</artif...原创 2020-03-04 20:18:16 · 538 阅读 · 0 评论 -
HtmlCleaner解析HTML
HtmlCleaner是一款高效的HTML解析器,支持 Xpath语法提取HTML中的节点或元素。1.添加依赖<dependency> <groupId>net.sourceforge.htmlcleaner</groupId> <artifactId>htmlcleaner</artifactId> <...原创 2020-03-03 15:12:20 · 1235 阅读 · 0 评论 -
Xpach语法
Xpach语法 表达式 描述 案例 案例含义 codename 选取此节点等所有子节点 body 选取<body>元素等所有 子节点 / 从根节点选取 /html 选取根节点<html> // 从选择等当前选择文件中的 子节点,而不考虑它们的位置 //div 选取所...原创 2020-03-03 15:02:37 · 382 阅读 · 0 评论