分布式
青夜梓藤
这个作者很懒,什么都没留下…
展开
-
风铃虫入门教程:快速创建风铃虫
风铃虫实例主要有以下两种构建方式通过风铃虫对象构建 //创建一个提取规则 //该提取规则标识使用 XPATH提取器进行提取,XPATH的表达式为 //h1[@class='topic-_XJ6ViSR']/text() , 该提取提取器的作用顺序是0 FieldExtractRule extractRule = new FieldExtractRu...原创 2019-12-19 20:21:27 · 884 阅读 · 1 评论 -
风铃虫入门教程
风铃虫是一款轻量级的爬虫工具,似风铃一样灵敏,如蜘蛛一般敏捷,能感知任何细小的风吹草动,轻松抓取互联网上的内容。它是一款对目标服务器相对友好的蜘蛛程序,内置了二十余种常见或不常见的浏览器标识,能够自动处理cookie和网页来源信息,轻松绕过服务器限制,智能调整请求间隔时间,动态调整请求频率,防止对目标服务器造成干扰。此外,风铃虫还是一款对普通用户十分友好的工具,它提供的大量链接提取器和内容提取器让...原创 2019-12-19 17:28:06 · 787 阅读 · 3 评论