拼多多&网易爬虫面试(已拿到offer)

本文分享了拼多多和网易爬虫工程师的面试经历,包括电话面、现场面、技术面和HR面的详细问题,涉及HTTP/TCP协议、线程进程、Python GIL、布隆过滤器、爬虫策略设计、验证码处理、Redis、逆向工程、数据抓取流程设计等内容,以及面试后的福利和工作情况。
摘要由CSDN通过智能技术生成

拼多多爬虫工程师面试题

电话面:

  • http协议、tcp协议(几次握手)

  • top命令

  • Linu/Mac 下虚拟内存(Swap)

  • 线程、进程、协程

  • Async 相关、事件驱动相关

  • 阻塞、非阻塞

  • Python GIL

  • 布隆过滤器原理:如何实现、一般要几次哈希函数

给我留下了一个作业:抓取天猫超市上某些商品的可以配送省份信息。(当时做这个也花了很久,主要是需要解决PC端的登陆问题,后来通过h5接口)

现场面(3小时):

一面(技术):

一面是之前电话面的,主要问了之前布置的作业相关

  1. 问了下之前留给我的作业,各种详细的细节,每一步怎么做的,遇到了哪些问题,自己是怎么解决的

  2. 说了下淘宝登陆的两种方法,自己写的一些中间件

  3. 还问了些之前的项目细节,爬虫资源配置怎么做的

  4. 就我简历上的东西问了下底层的东西:线程与进程,协程用的Linux底层的是什么技术,事件驱动,MySQL的索引底层是什么,查询怎么做的等等。(这些问题都不知道)

  5. 验证码如何处理,TensorFlow训练成功率多少

  6. redis快的原因是什么,底层原因,你平常用到了哪些数据结

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值