爬虫和蜘蛛的区别是什么？

最新推荐文章于 2022-09-12 09:26:50 发布

yydaren

最新推荐文章于 2022-09-12 09:26:50 发布

阅读量1.1k

点赞数

分类专栏：爬虫文章标签：搜索引擎爬虫网络爬虫

原文链接：https://www.2808proxy.com/blogs/187.html

版权

爬虫蜘蛛数据提取网络发现搜索引擎

关键词由CSDN通过智能技术生成

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

你经常会听到程序员们谈论爬虫(Crawler)，有的时候叫蜘蛛(Spider)，你知道爬虫和蜘蛛的区别是什么吗？

简单来说

简单的来说，爬虫关注从一个或多个预定义的网站中提取特定数据。而蜘蛛专注于在网络上发现新的URL。

不同的目的

更深入地来说，Spider和Crawler的目的和它们的工作方式也有很大的不同。

在Crawler中，一切都与数据有关。您要从特定网站提取的数据字段。程序通常知道目标网站，虽然可能不知道具体的页面URL，但至少域名是限定内的。

而Spider可能既不知道具体的 URL，也可能不知道域名。通常来说，搜索引擎的抓取系统都是Spider，这些Spider用来索引页面并将其显示在搜索结果中。

不同的输出

对于Spider来说，输出数据是URL本身。

对于Crawler来说，我们通常会关注相当多的字段。 URL可以是符合pattern的一组URL，当Crawler抓取时，你提取的数据通常是网站上显示的其他数据字段，例如商品标题、价格、销量、评论等，主要取决于你的业务。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫和蜘蛛的区别是什么？

你经常会听到程序员们谈论爬虫(Crawler)，有的时候叫蜘蛛(Spider)，你知道爬虫和蜘蛛的区别是什么吗？简单来说简单的来说，爬虫关注从一个或多个预定义的网站中提取特定数据。而蜘蛛专注于在网络上发现新的URL。不同的目的更深入地来说，Spider和Crawler的目的和它们的工作方式也有很大的不同。在Crawler中，一切都与数据有关。您要从特定网站提取的数据字段。程序通常知道目标网站，虽然可能不知道具体的页面URL，但至少域名是限定内的。而Spider可能既不知.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。