Python工程师面试汇总

A公司(爬虫工程师)

1.国际惯例,请您做一下自我介绍?

2.说一下你为什么从上一家公司中离职?

3.HTTP你了解吗,有几次握手?

4.说说你在爬取网站的过程中,哪家或者哪几家公司是你觉得最难爬的,为什么?

5.验证码识别你了解吗,你遇到过需要验证码识别的网站吗,你是怎么处理的?

6.Tesseract的工作原理是什么,你是怎么训练你的Tesseract?

7.封IP后你是如何处理的,你是如何获取代理IP的

8.redis的工作原理?它是通过什么来去重的?

9.假如某一事件有好几家网站进行报道,你是通过是什么来判断这几家网站报导的是同一间事件(也就是所谓的去重)?

建议:多媒体(微信方面)

B公司(爬虫工程师)

首先是笔试,有Linux基础(如何查看目录、如何查看磁盘内存以及如何删除某一字符串类型的进程问题)、Java基础(单例设计模式、JVM的内存结构、gc原理)、Web方面(session和cookie的解释、HTTTP的几次握手、如何判断一个单链表是闭合的还是开放的)

1.国际惯例,请您做一下自我介绍?

2.你是学python的对吗,假设我是一个不懂编程语言的人,你给我介绍一下python?

3.给我说说你为什么从上一家公司中离职?

4.你学编程多久了,都学了哪些内容?

5.来说说你的项目吧,说一下你在整个Web项目中的职责?

6.你是怎么设计这整个Web项目的,都有哪些模块,以及又是如何与数据库进行交互的?

7.谈一下你的另外一个项目吧,你都爬了哪些网站,说说你觉得印象最深刻的或者你觉得最难爬的一个网站?

最后又做了套笔试题:两个有50亿个URL的文件A,B,每个URL大小为64字节,现有4G内存,磁盘大小为500G,设计一个方案来取出这两个文件相同的URL。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值