Python 面试题

准备一下python 面试题
2018/11/23 刘 面爬虫

1.爬取的网站中有数据混淆怎么处理
2.你知道ssh免密登录么
3.mongodb 主从复制怎么实现的
4.过亿级数据去重 位图
5.分布式怎么部署的
6.你了解Redis的哨兵机制
7.爬取的网站具体说一下


2018/11/01

0.python

  1. Python垃圾回收机制
  2. 先问迭代器、装饰器、生成器,协程,协程在项目里怎么用的(重点)
  3. 列表 元组
  4. python2和python3的区别
  5. rest framework接口规范
  6. range函数
  7. 多线程 多进程
  8. 位运算符
  9. Python的数据类型
  10. python多线程与其他语言多线程的区别
  11. python中的字典
  12. 多线程和协程两者之间的关系?
  13. 多线程在多核中 能都跑满吗(4核4个线程)
  14. serch、meatch
  15. python是什me

1.web

  1. 说一下Python登录 、注册怎么实现,说一下原理,登录 注册用什么接口
  2. 用户登录之后 怎么验证成功
  3. 说一下购物车怎么实现,用的什么技术
  4. 说一下订单原理
  5. 多进程线程是什么,项目里怎么应用(重点)
  6. python异步(重点),高并发是什么,怎么实现
  7. 遇到一个验证码,怎么识别它,(可以说打码平台,甩锅)
  8. 做项目遇到的bug,怎么解决
  9. 做的项目中的什么模块 怎么实现的
  10. 怎么实现的乐观锁 乐观锁的优先级别是什么 odo?
  11. 密钥激活的方法
  12. 一个服务器一直开着浪费资源
  13. 怎么不用服务器保证客户无法把软件产品分享给别人
  14. 项目中用到的第三方类库
  15. 项目中你们用到的部署?
  16. tcp/udp http/https socket编程 tcp与socket的关系 http和https区别
  17. 各种状态码
  18. web的 API,AWS,DOCKER
  19. list列表有对象,对象的属性排序
  20. (web)店铺剩余5个商品,有5+人来买,怎么保证让所有人买到
  21. 数据库有没有用到缓存?怎么查询hash里面的值?
  22. 闭包
  23. 装饰器方式手写单例模式
  24. 手写XPATH匹配方
  25. 式进行赛选式进行赛选
  26. csrf的原理 底层实现
  27. 手写数据结构 手写sql语句 手写linux命令 linux中的shell脚本 、
  28. .网络通讯:socket:手写客户端服务端通讯
  29. 序列的相关操作
  30. cmdb gevent orm
  31. 跨站脚本攻击、支付模块怎么实现
  32. 回调函数、回调机制、监听机制

2.爬虫

  1. 爬虫里的数字验证码怎么实现的?
  2. 项目里面哪些用到事务
  3. 反爬虫策略
  4. 除了常见的反爬机制 再设计几种反爬机制
  5. 爬取手机app端的可以做吗
  6. 有些网站的信息写在图片中 怎么获取图片中的关键信息
  7. 用抓包工具怎么获取数据
  8. 爬取的数据怎么入库 爬虫项目存到哪,使用的技术
  9. mongodb是什么库
  10. 一种网站一分钟只允许访问两次 怎么可以一直爬取?
  11. 对数据清洗去重?(并且去除无效信息) 数据清洗提取 清洗用到的是numpy
  12. 爬取数据量和爬取了什么数据
  13. ip被封问题(所有ip都被封)
  14. scrapy框架与request,urllib有什么区别
  15. 视频怎么爬
  16. 怎么实现断点续传
  17. 如果爬取整个网页的数据,数据量非常大,怎么以最小的内存存入数据库
  18. 怎么判断一个ip是否失效
  19. cookie池 智能爬取
  20. 爬取评论怎么保证没缺少数据
  21. 部署过爬虫项目没
  22. 爬虫接口类工作是什么工作?
  23. 爬取后放在什么数据库?以什么形式保存?
  24. 用过定时爬取没?
  25. 分析金融网站的数据,怎么爬取?
  26. 加密字段怎么解密去爬取
  27. 怎么优化爬虫程序

3.算法

  1. 冒泡排序
  2. 快排时间复杂度
  3. 用python写二叉树
  4. 手写排序
  5. 堆和栈的存储原理、优缺点
  6. 数组和链表,怎么查询?优缺点?
  7. 几个字符串长度不一样,根据长度长短排序,用一行代码;
  8. 用python写一个斐波那契数列 深度递归文件夹
  9. 使用python语言使用实现以递归方式对指定磁盘文件资源深度遍历检索。

4.数据库

  1. 数据库的去重,数据库的清洗(重点),pandas的相关问题
  2. Mesql的左右连接
  3. 数据库事务的隔离级别
  4. Mesql怎样提高它的插入速度
  5. 什么情况下使用mysql,mongodb
  6. 数据库的优化
  7. mysql mongodb优点缺点
  8. 存取海量数据怎么优化
  9. 手写redis事务

5.Linux

  1. Linux下面常用命令
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值