爬虫
猿与禅
think more , write less , more value !
君子藏器于身,待时而动,争其必然,顺其自然
展开
-
Java爬虫实战-采集完整的五级国家行政区域码数据
Java爬虫实战-获取国家行政区域码, 主要通过Xpath解析html,利用WebMagic实现对页面各级链接的递归爬取原创 2023-02-20 11:45:19 · 367 阅读 · 0 评论 -
爬虫-java-webmagic-搜视节目单(输出到单个文件)
webmgic 架构图(来自作者官方文档): Processor:public class TvSouProcessor implements PageProcessor { Map channelCodeMap = NIOUtils.csvFile2Map(TvSouConstant.CHANNELMAP_FILEPATH); private Site site = Site.me(原创 2017-03-04 10:33:26 · 1161 阅读 · 0 评论