疯子采集器
hwbbbb
这个作者很懒,什么都没留下…
展开
-
疯子网页采集器教程之提取链接
本教程要采集的站点为http://www.youlu.net/classify/2-1219-183-1.html第一步:打开地址第一页地址为http://www.youlu.net/classify/2-1219-183-1.html下一页/第二页http://www.youlu.net/classify/2-1219-183-2.html第三页http://www.you...原创 2018-11-17 05:00:43 · 879 阅读 · 0 评论 -
疯子网页采集器之提取内容教程
疯子网页采集器之提取内容教程第一步:填写“链接开始”,0就是第一个链接,4就是第五个链接,这里填0填写“地址变化”,比如4就会采集第1、5、9...的链接,这里填1“保存图片”:采集图片,如果选择打钩保存图片地址,就必须填写首页地址,就是要采集的网站的首页地址,没有填写保存图片会出错“图片本地化”:把图片保存到服务器点击“浏览器”,在地址栏输入内容页地址比如 http...原创 2018-11-17 05:02:55 · 599 阅读 · 0 评论 -
疯子网页采集器教程之采集需要保存图片的教程
疯子网页采集器教程之采集需要保存图片的教程 第一步:选中 “保存图片”第二步:填写规则图片开始标签:默认为 (?:src)=" 一般不需要修改图片规则:(.*?\.jpg-n|.*?) 把jpg-n改为要获取的图片的扩展名,比如gif或者png等图片终止标签:"></A> </DIV>[\s\S][\d\D]...原创 2018-11-17 05:04:25 · 226 阅读 · 0 评论 -
疯子网页采集器教程之图片本地化教程
疯子网页采集器教程之图片本地化教程第一步:选中 “图片本地化”填写首页地址,比如http://www.zhuvl.com必需填写http://否则会出错第二步:在服务器根目录添加目录s_c/ssss_cccc/第三步:编辑ssss.php找到if (rename('s_c/ssss_cccc/'.basename($href),'s_c/ss_cc_24/6/'.$s0.'...原创 2018-11-17 05:05:27 · 584 阅读 · 0 评论 -
疯子网页采集器之测试发布教程
疯子网页采集器之测试发布教程第一步:先登录,如果没有设置发帖需要登录这步可以省略填写发帖页面http://localhost/forum.php?mod=post&action=newthread&fid=40点击发帖页面,等网页加载完再点击代码把代码用dreamweaver或别的网页编辑器打开方便浏览第二步:标题规则在代码中找到标题的表单代码INPUT...原创 2018-11-17 05:06:11 · 290 阅读 · 0 评论 -
疯子页面采集器视频
疯子页面采集器视频原创 2018-11-17 05:07:23 · 139 阅读 · 0 评论 -
疯子网页采集器教程之瀑布流法
疯子网页采集器教程之瀑布流法第一步:填写页面地址http://www.sohu.com/c/8/1461共几页,测试写10页点瀑布流法里的“开始”到第10页会自动终止,也可以手动点瀑布流法里的“终止”可以点“显示浏览器”看页面第二步:填写链接提取规则,方法和标准法一样规则写好点“提取链接”第三步:提取内容链接提取好点”下一步“提取内容”先填写提取规...原创 2018-11-17 05:08:08 · 367 阅读 · 0 评论 -
疯子网页采集器教程之下一页原页法
疯子网页采集器教程之下一页原页法第一步:填写页面地址http://www.xinhuanet.com/fortune/共几页:这里测试写4第二步:下一页原页法配置用360浏览器打开页面http://www.xinhuanet.com/fortune/把鼠标移到“显示更多”上,右击“审查元素”标签特征:显示更多 地址规则:SPAN 点“开始” 到第4页会自...原创 2018-11-17 05:08:55 · 264 阅读 · 0 评论 -
疯子网页采集器教程之下一页翻页法
疯子网页采集器教程之下一页翻页法 下一页翻页法方法和“下一页原页法”一样原创 2018-11-17 05:09:39 · 806 阅读 · 0 评论