2020 BAT大厂面试经验:最全大数据+AI方向面试100题(附答案详解)

“高频面经“系列共分为五篇,数据分析篇数据结构与算法篇大数据研发篇机器学习篇深度学习篇,每篇20问,共100问。这“100问”,与其说是面试中出现频率较高的“考题”,更不如说是大数据和AI方向构建完整知识体系的“知识点”。点击下方各篇链接即可进入查阅相应参考答案,更好内容直接关注公众号“雨云飞”回复“学习资料”获取!

       欢迎关注作者微信公众号:涉及数据分析与挖掘、数据结构与算法、大数据与机器学习等内容

目录

数据分析篇

数据结构与算法篇

大数据研发篇

机器学习篇

深度学习篇


 

数据分析篇

数据分析主要侧重产品sence与Hive使用

目录

  1. Mysql中索引是什么?建立索引的目的?
  2. sql语句执行顺序?
  3. 数据库与数据仓库的区别?
  4. OLTP和OLAP的区别?
  5. 行存储和列存储的区别?
  6. Hive执行流程?
  7. Hive HDFS HBase区别?
  8. 数仓中ODS、DW、DM概念及区别?
  9. 窗口函数是什么?实现原理?
  10. 数仓中维度建模含义?有哪几种模式?
  11. Hive数据倾斜表现、原因及处理?
  12. 用Python怎么进行数据分析?
  13. 数据缺失值处理办法
  14. Excel中数据透视表,vlookup?
  15. AB测试与假设检验?
  16. TO C指标体系?
  17. 如果次留下降了 5%该怎么分析?
  18. 贝叶斯公式复述并解释应用场景
  19. CPA、CPS、CPM、CPT、CPC 是什么?
  20. AARRR模型是什么?

数据结构与算法篇

数据结构与算法侧重核心思路阐述和手撕代码

目录

  1. 什么是链表、队列、堆栈、树图?
  2. 删除链表中重复的节点(剑指offer 83)
  3. 两数相加(Leetcode 2)
  4. 反转链表、环形链表、合并链表
  5. 创建包含min函数的栈
  6. 二叉树的最大(最小)树深
  7. 二叉树的遍历
  8. 通过前序和中序推后序(重建二叉树)
  9. 二叉树的最近公共祖先(leetcode 236)
  10. 电话号码的字母组合(leetcode 17)
  11. 求1+2+...+n(剑指offer 47)
  12. 有效括号(leetcode 20)
  13. 最长公共前缀(leetcode 14)
  14. 排序算法有哪些?
  15. 快速排序实现
  16. 求TopK(堆排序)
  17. 01背包(动态规划)
  18. 数据流中的中位数(剑指offer 63)
  19. 买卖股票的最佳时机(leetcode 121)
  20. 矩阵中的最短路径(剑指offer 65)

大数据研发篇

大数据研发侧重组件框架原理和编程实践经验

目录

  1. linux常用命令
  2. Java虚拟机、垃圾回收机制
  3. TCP “三次握手”、 “四次挥手
  4. 大数据常见组件
  5. ​HDFS存储机制
  6. MapReduce基本流程
  7. Hadoop Shffule原理
  8. Hadoop常用命令
  9. Hadoop优化
  10. Hadoop分片、分区
  11. Hive常用高阶命令
  12. Redis特性
  13. Redis、传统数据库、HBase、Hive区别
  14. Kafka、Flume对比
  15. Spark执行流程
  16. Spark RDD是什么?
  17. Spark stage划分原理
  18. Spark与Hadoop区别与联系
  19. Flink API和流/批处理引擎
  20. Storm Spark-streaming Flink对比

机器学习篇

机器学习注重原理理解|算法对比及场景使用

目录

  1. 常见分类算法及应用场景
  2. 逻辑回归推导
  3. SVM相关问题
  4. 核函数使用
  5. 生成模型和判别模型基本形式
  6. ID3,C4.5和CART区别
  7. 交叉熵公式原理
  8. L1和L2正则化的区别
  9. 传统机器学习模型有哪些
  10. k-means算法流程
  11. DBSCAN和Kmeans对比
  12. LDA原理
  13. PCA与SVD的关系
  14. 推荐系统常用模型
  15. 协同过滤适用场景及冷启动
  16. Bagging和Boosting区别
  17. XGBoost和GDBT区别
  18. SGD,Momentum,Adagard,Adam原理
  19. 过拟合原因及解决办法
  20. LightGBM优势

深度学习篇

深度学习在机器学习基础上知识迭代更加迅速

目录

  1. 反向传播主要思想及推导
  2. 简要概述HMM、CRF、EM、GMM
  3. 衡量分类器好坏指标
  4. 正负样本不平衡的解决办法
  5. 常用激活函数
  6. Tensorflow的工作原理
  7. 深度学习框架对比
  8. ResNet原理及与DenseNet对比
  9. BatchNormalization思想及作用
  10. 卷积层和池化层有什么区别?
  11. 为什么使用小卷积核而不是大卷积核?
  12. Faster-RCNN跟RCNN有什么区别?
  13. GRU、LSTM对比
  14. 梯度消失、梯度爆炸原因及解决方案
  15. Seq2Seq模型理解
  16. 怎么提升网络的泛化能力
  17. attention机制原理
  18. GAN网络的思想
  19. word2vec训练过程
  20. 布隆过滤器原理及场景

 

整体目录为:

2020 BAT大厂数据分析面试经验:“高频面经”之数据分析篇

2020 BAT大厂数据挖掘面试经验:“高频面经”之数据结构与算法篇

2020 BAT大厂数据开发面试经验:“高频面经”之大数据研发篇

2020 BAT大厂机器学习算法面试经验:“高频面经”之机器学习篇

2020 BAT大厂深度学习算法面试经验:“高频面经”之深度学习篇

  • 1
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值