疯子网页采集器教程之下一页原页法
第一步: 填写页面地址 http://www.xinhuanet.com/fortune/ 共几页:这里测试写4 第二步:下一页原页法配置 用360浏览器打开页面 http://www.xinhuanet.com/fortune/ 把鼠标移到“显示更多”上,右击“审查元素”
标签特征:显示更多 地址规则:SPAN 点“开始” 到第4页会自动终止,也可以手动点瀑布流法里的“终止” 点“显示浏览器”可以看页面 第三步:填写链接提取规则,方法和标准法一样 规则写好点“提取链接” 第四步:提取内容 链接提取好点”下一步“提取内容” 先填写提取规则,方法还是和标准法一样