python爬虫工程师面经（2023年金三银四）

最新推荐文章于 2024-04-30 16:13:15 发布

九月镇灵将

最新推荐文章于 2024-04-30 16:13:15 发布

阅读量1k

点赞数 2

分类专栏：爬虫讲解文章标签： python 爬虫开发语言面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43845191/article/details/129886967

版权

爬虫讲解专栏收录该内容

11 篇文章 9 订阅

订阅专栏

python爬虫工程师面经

前言
面经总结
总结

前言

过年期间，经过自我慎重的考虑后，终于决定在2月份向公司提出了辞职，说实话很慌，也做好了长时间找不到工作的准备，只是继续呆在公司对自我发展毫无意义，找了差不多一个月，面试了六家公司，最后确定了一份工作，在这里分享一下我的面经。

面经总结

发展相关问题

自我介绍
离职原因
优点与缺点
发展规划

个人觉得上面四个问题是面试者经常被问到的，建议大家可以在准备面试时准备好问题的答案，注意下面：
离职原因

不要说得太极端，不要过度涉及上家公司的不好
优缺点可以更多偏向专业技能、业务理解，这里的缺点有时不一定要说实在的缺点，比如可以说对行业发现的了解程度还不深，可以与面试的公司挂钩

爬虫基础相关问题

深拷贝与浅拷贝的区别
scrapy原理介绍
布隆过滤器原理与使用场景
数据库主键、索引优化
装饰器介绍
进程、线程区别，进程多用于CPU计算型任务
扣算法、补环境、自动化工具工作原理
pyspride与scrapy区别
scrapy-redis与scrapy区别
redis数据结构类型、雪崩

工作经验相关问题

AST经验
app、小程序采集经验
补环境使用场景、补过哪些参数
selenium遇到过哪些环境检测，怎么处理
fillder、hook使用场景
app、小程序采集能力介绍
文本混淆场景：CSS、SVG、自定义字体处理
selenium worker 托管
post请求上千个参数怎么根据账号差异处理好请求
点选验证码处理
遇到的反爬难题与解决方案
环境检测：吐环境、浏览器调试报错位置，确定缺失的标签
养账号，账号封控
爬虫部署，单机，分布式
爬虫健康性监控：报警+维护，日志
ip池维护，供应商，维持稳定性
反爬，js逆向，响应数据加密
中英文网站，数据转换，名单互采
多爬虫采集来源，数据一致性保证，入库判断
tcp协议，无法抓包
人机交互验证，处理方案

这些问题基本都是面试官根据我简历上面的项目经验提问的，有一些会是在提问项目时延展到面试官公司项目实际遇到的问题，这些更多考验的是面试者的工作经验和解决问题思维。当然，上面的问题我们也可以去阅读相关博客，了解其中的技术点与解决方案。

总结

其实多次面试后，发现面试的内容大同小异，偏差不大，所以后面基本都不怂了，想想一开始面试的紧张hh，也幸好最后确定了工作。

九月镇灵将

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
python爬虫工程师面经（2023年金三银四）

过年期间，经过自我慎重的考虑后，终于决定在2月份向公司提出了辞职，说实话很慌，也做好了长时间找不到工作的准备，只是继续呆在公司对自我发展毫无意义，找了差不多一个月，面试了六家公司，最后确定了一份工作，在这里分享一下我的面经。自我介绍离职原因优点与缺点发展规划个人觉得上面四个问题是面试者经常被问到的，建议大家可以在准备面试时准备好问题的答案，注意下面：离职原因不要说得太极端，不要过度涉及上家公司的不好。
复制链接

扫一扫

专栏目录

九月镇灵将 CSDN认证博客专家 CSDN认证企业博客

码龄6年

74: 原创

12万+: 周排名

2万+: 总排名

8万+: 访问

: 等级

1207: 积分

894: 粉丝

302: 获赞

45: 评论

537: 收藏

私信

关注

热门文章

分类专栏

最新评论

Windows与Android实现Charles证书设置
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
爬虫逆向学习(五)：使用RPC框架serkio解决逆向难题
九月镇灵将: 是的，很早就升级了，听别人说是增加了 cookie
爬虫逆向学习(五)：使用RPC框架serkio解决逆向难题
2401_83558326: 接口是升级了吗，直接替换cookie 会报错。替换ssotoken也报错
Python requests发送multipart/form-data请求
九月镇灵将: 额，有点忘记了 [code=python] data = { "method":(None,'queryWhjyxk'), "params":(None,json.dumps({"companyName":"","registrationNumber":""})) } # post请求所有参数需要这样写入 [/code] 忘记场景是字符串还是json，你试试dumps传进去，和直接json传进去看看哪个可以
Python requests发送multipart/form-data请求
-青辰-: 你好麻烦问一下，如果要穿多层嵌套的字典应该怎样传：例如： { "workflowId": 10856, "customerId": 127922, "topic":"咨询", "CASE_STUDY_LEVEL": 0, "creatorId": 1081011, "handlerType": 0, "handlerId": 1081011, "form": { "id": 32198, "name:": "历史_个案", "fields": [ { "id": 285222, "name": "历史_创建日期", "type": 12, "required": 0, "value": "2020/12/31" }, { "id": 284285, "name": "历史_个案编号", "type": 1, "required": 0, "value": "00099339" } ]}}

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九月镇灵将 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。