拼多多爬虫工程师面试题
电话面:
http协议、tcp协议(几次握手)
top命令
Linu/Mac 下虚拟内存(Swap)
线程、进程、协程
Async 相关、事件驱动相关
阻塞、非阻塞
Python GIL
布隆过滤器原理:如何实现、一般要几次哈希函数
给我留下了一个作业:抓取天猫超市上某些商品的可以配送省份信息。(当时做这个也花了很久,主要是需要解决PC端的登陆问题,后来通过h5接口)
现场面(3小时):
一面(技术):
一面是之前电话面的,主要问了之前布置的作业相关
问了下之前留给我的作业,各种详细的细节,每一步怎么做的,遇到了哪些问题,自己是怎么解决的
说了下淘宝登陆的两种方法,自己写的一些中间件
还问了些之前的项目细节,爬虫资源配置怎么做的
就我简历上的东西问了下底层的东西:线程与进程,协程用的Linux底层的是什么技术,事件驱动,MySQL的索引底层是什么,查询怎么做的等等。(这些问题都不知道)
验证码如何处理,TensorFlow训练成功率多少
redis快的原因是什么,底层原因,你平常用到了哪些数据结