自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 前嗅ForeSpider数据建表和高级配置界面介绍

今天,小编为大家介绍一下,前嗅ForeSpider的数据建表,和高级配置界面,具体内容如下: 一,数据建表【数据建表界面】1.采集表单数据采集之后需要存入数据库,在ForeSpider中创建的表单,就是数据采集入库的表结构。不同的频道可以使用同一个表单,创建任意多个数据表。【采集表单】 2.表单配置用于配置字段属性、采集内容、数据类型、数据长度、高级类型...

2019-01-28 13:35:20 621

原创 前嗅ForeSpider采集配置界面介绍

今天,小编为大家介绍一下,前嗅ForeSpider的采集配置界面,具体内容如下: 启动ForeSpider采集软件后,默认界面如图所示。ROOT任务下有已经配置好的示例模板,点击网站图标即可进行采集预览。可在任务列表选择某一任务按照需求重新配置。【采集配置界面】 1.任务列表【任务列表】任务对应着采集来源,通常一个采集来源对应着一个任务。如采集人民网时,人民网就...

2019-01-28 10:24:03 3114 1

原创 前嗅ForeSpider教程:采集58同城数据

今天小编为大家带来的教程是,采集58同城数据,同样适用于其他类似网站,具体操作如下: 第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,首先采集58同城·便当分类下的分类列表的链接,所以点击抽取链接,如图3:④完成后模板抽取配置列表有一个模板,默认模板,如图4: ...

2019-01-25 17:18:52 1597

原创 前嗅ForeSpider教程:采集美团网

今天,小编为大家演示一下,如何采集美团网数据,具体操作如下: 第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,首先当前检索结果列表链接,所以点击抽取链接,选择链接抽取,如图3:④完成后模板抽取配置列表有两个个模板,默认模板和新建模板,模板一的默认链接抽取已与模板二关联,如...

2019-01-25 17:14:08 3338

原创 前嗅ForeSpider教程:采集黄页88

今天小编为大家带来的教程是:采集黄页88,同时也适用于采集其他的企业信息网站,具体操作流程如下: 第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页联系方式链接,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,翻页选择普通翻页,如图3...

2019-01-25 17:07:30 2629

原创 前嗅ForeSpider教程:采集中国证券网

       前几天有人问如何采集中国证券网,小编整理了一下,在此为大家做一下演示,同样适用于其他金融经济型的网站: 第一步:新建任务①点击左上角“加号”新建任务,如图1: ②在弹窗里填写采集地址,任务名称,如图2:  ③点击下一步,选择进行数据抽取还是链接抽取,本次采集要闻列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所...

2019-01-25 17:02:12 634

原创 前嗅ForeSpider教程:采集CSDN

  上周小编介绍了如何采集360问答,今天小编再来为大家演示一下,如何采集CSDN论坛,同样适用于所有的自媒体论坛。 第一步:新建任务①点击左上角“加号”新建任务,如图1: ②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页博文的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链...

2019-01-25 16:40:09 1935

原创 前嗅ForeSpider教程:采集360问答

今天,小编来教大家如何采集论坛自媒体类网站的数据,以采集360问答为例,为大家进行演示操作,该操作同样适用于其他类似网站:第一步:新建任务①点击左上角“加号”新建任务,如图1:②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2:若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。③点击下一步,选择进行数据抽...

2019-01-25 16:21:04 2653

原创 前嗅ForeSpider教程:采集新浪新闻

   最近后台有很多童鞋问怎么采集新闻,今天小编以采集新浪新闻为例,来为大家进行演示,同样适用于其他新闻网站的采集,具体操作如下: 第一步:新建任务①点击左上角“加号”新建任务,如图1: ②在弹窗里填写采集地址,任务名称,如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,...

2019-01-25 15:51:24 1407

原创 前嗅ForeSpider教程:采集图片/视频/资源文件的链接地址

       昨天为大家介绍了如何采集图片/视频/资源文件后,有小伙伴问我如何采集他们的链接地址,今天小编就为大家演示如何采集图片/视频/资源文件的链接地址,操作如下: 第一步:新建任务①点击左上角“加号”新建任务,如图1: ②在弹窗里填写采集地址,任务名称如图2:③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入...

2019-01-25 15:46:48 3676

原创 前嗅ForeSpider采集:采集图片/视频/资源文件

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】② 弹窗里填写采集地址,任务名称如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集所有页面的图片,图片链接是通过点击图片列表链接进入的,所以本次需要抽取列表图片链接,所以点击抽取链接,如图3:【图3】第二步:选择链接类型由于本次需要取到的是图片链接,图片链接不同于其他网页链接...

2019-01-16 17:08:22 2673

原创 使用前嗅ForeSpider在同一个网站中从另一页面采集数据

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集企业最新动态链接列表,所以点击抽取链接,选择链接列表,如图3:【图3】④完成之后,在模板抽取配置下生成两个模板,默认模板:01和链接列表:02。模板1中的“链接列表”链接抽取已与模板2关联,如图4...

2019-01-15 11:07:28 903

原创 使用前嗅ForeSpider采集网页链接/源码/时间/重定向地址等

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②弹窗里填写采集地址,任务名称,如图2:【图2】③ 点击下一步,勾选抽取链接,选择网页内所有链接,如图3:【图3】④完成后模板抽取配置列表有一个模板,默认模板。默认模板下自动生成一个链接抽取,名称为网页全部链接,如4:【图4】第二步:创建新的模板,并新建数据抽取①模板配置,点击“新...

2019-01-14 10:59:11 1451

原创 使用前嗅ForeSpider采集需要登陆的网页内容

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②弹窗里填写采集地址,任务名称,开启手动登录配置,如图2: 【图2】若未在此处开启登录配置,可在模板抽取配置中点击相应的模板,开启登录配置,如图3。【图3】③点击下一步,选择进行数据抽取还是链接抽取,本次采集列表下的正文数据,所以本次需要抽取内容选择链接列表,所以点击抽取链接,选择链接列表,如图4...

2019-01-14 10:56:16 2818

原创 使用前嗅ForeSpider通过搜索框检索关键词采集数据

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址、任务名称,由于此次需要配置关键词,所以在新建任务时,需要勾选一下“关键词采集”如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集需要采集列表页中正文的所有文本信息,所以此处需要勾选“抽取链接”-“普通翻页”,如图3:【图3】第二步:配置关键词①由于在创...

2019-01-14 10:54:21 1851

原创 使用前嗅ForeSpider采集列表和正文的数据

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】② 弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前页面子栏目下的列表房源的正文数据,子栏目房源列表是通过点击子栏目链接进入的,所以本次需要抽取子栏目链接,所以点击抽取链接,选择子栏目,如图3:【图3】④  完成后模板抽取配置列表有两个模板,默...

2019-01-14 10:53:05 3629

原创 前嗅教程:通过子栏目进入链接列表采集正文数据

第一步:新建任务①点击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称,如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前页面子栏目下的列表房源的正文数据,子栏目房源列表是通过点击子栏目链接进入的,所以本次需要抽取子栏目链接,所以点击抽取链接,选择子栏目,如图3:【图3】④完成后模板抽取配置列表有两个模板,默认模...

2019-01-09 09:29:01 1396

原创 前嗅教程:采集表格/列表页中的数据(翻页)

以孔夫子旧书网的最近出版板块为例(http://www.kongfz.com/1004/)为例,采集列表页的所有数据:第一步:新建任务①击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称如图2: 【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集需要采集当前板块的列表页所有内容,所以只需要在同一个模板中进行翻页链接抽取以及数据抽取即...

2019-01-08 11:17:46 1099

原创 前嗅教程:采集表格/列表页中的数据(不翻页)

第一步:新建任务① 击左上角“加号”新建任务,如图1:【图1】②在弹窗里填写采集地址,任务名称如图2:【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集需要采集当前页面列表中的所有内容,所以只需抽取列表数据即可,点击“抽取数据”,如图3:【图3】第二步:创建/选择表单在ForeSpider爬虫中,表单是可以复用的,所以可以在数据表单出直接选择之...

2019-01-08 11:16:49 603

原创 前嗅教程:采集正文数据(翻页)

第一步:新建任务①点击左上角“加号”新建任务,如图1: 【图1】②在弹窗里填写采集地址,任务名称如图2: 【图2】③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点击列表链接进入的,所以本次需要抽取列表链接,所以点击抽取链接,如图3: 【图3】第二步:通过智能过滤,得到所需链接。①按住Ctrl+鼠标左键点击所需...

2019-01-08 11:13:16 685

原创 前嗅教程:采集正文数据(不翻页)

上周前嗅ForeSpider5.0已经和大家见面了,那么如何用ForeSpider5.0来采集各网页的正文数呢?今天小编就以采集凤凰网新闻正文为例为大家详细的介绍一下具体操作流程:第一步:新建任务①点击左上角“加号”新建任务,如图1:②在弹窗里填写采集地址,任务名称如图2:  ③点击下一步,选择进行数据抽取还是链接抽取,本次采集当前列表页新闻的正文数据,正文数据是通过点...

2019-01-04 17:20:30 902

采集收视率排名网排名数据

采集收视率排名网排名数据

2022-12-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除