Python开发工程师面试题之爬虫面试题分享

大模型应用场景

已于 2024-01-06 21:42:38 修改

阅读量436

点赞数

文章标签： python 爬虫开发语言学习面试

于 2023-06-10 11:21:29 首次发布

本文链接：https://blog.csdn.net/Java_ZZZZZ/article/details/131139945

版权

文章提供了Python爬虫工程师面试的常见问题，包括scrapy与scrapy-redis的区别，scrapy框架的工作机制，GET和POST请求的不同以及应用场景。同时，文章强调了学习Python的重要性，并分享了Python学习资料和面试资料链接。

摘要由CSDN通过智能技术生成

Python开发工程师的就业方向非常多，其中一个方向就是python爬虫开发工程师，这也是很多企业热招的岗位之一。如何能提高自己面试的成功率，不仅仅需要开发者在学习工作中不断的积累专业技能知识，最关键的是在面试过程中能正常发挥。下面为大家提供几个Python爬虫工程师面试的题目，希望对大家的面试有帮助。

在这里插入图片描述

一、scrapy 和 scrapy-redis 有什么区别？

答：scrapy 是一个 Python 爬虫框架，爬取效率极高，具有高度定制性，但是不支持分布式。而 scrapy-redis 一套基于 redis 数据库、运行在 scrapy 框架之上的组件，可以让scrapy 支持分布式策略，Slaver 端共享 Master 端 redis 数据库里的 item 队列、请求队列和请求指纹集合。

二、描述下 scrapy 框架运行的机制？

答：从 start_urls 里获取第一批 url 并发送请求，请求由引擎交给调度器入请求队列，获取完毕后，调度器将请求队列里的请求交给下载器去获取请求对应的响应资源，并将响应交给自己编写的解析方法做提取处理：1. 如果提取出需要的数据，则交给管道文件处理；2. 如果提取出url，则继续执行之前的步骤（发送url请求，并由引擎将请求交给调度器入队列…)，直到请求队列里没有请求，程序结束。