![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
面试
今天学习了嘛
这个作者很懒,什么都没留下…
展开
-
【基础知识】数据研发相关
主要是对比B树和B+树的区别 B+树的磁盘读写代价更低:B+树的内部节点并没有指向关键字具体信息的指针,因此其内部节点相对B树更小,如果把所有同一内部节点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多,一次性读入内存的需要查找的关键字也就越多,相对IO读写次数就降低了。 B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当转载 2020-09-09 19:50:56 · 200 阅读 · 0 评论 -
Deecamp 面试翻车记录
挺过了阿里五面,美团四面,结果在Deecamp面试翻车了,特此记录,收获很大。没有编程,面试官是创新工场的算法工程师,人很不错。ROC曲线如何绘制 AUC的含义 梯度下降法和牛顿法的区别 如何防止过拟合,分别从机器学习还有深度学习两方面去说 说一说正则化中L1范数和L2范数的区别 具体说一说正则化项是如何实现防止过拟合的 LSTM和RNN的区别?LSTM的激活函数是什么? 如...原创 2019-06-04 18:51:29 · 1389 阅读 · 3 评论 -
ALI-数据研发-四面
1. 如何评估机器学习算法的性能指标?分类问题精确率精确率(precision)是指模型预测为真,实际也为真的样本数量占模型预测所有为真的样本数量的比例。举例来说明,比如警察要抓小偷,抓了 10 个人,其中有 6 个人是小偷,那么精确率就是 6/10 = 0.6。召回率召回率(recall)有时候也叫查全率,是指模型预测为真,实际也为真的样本数量占实际所有为真的样本数量的...原创 2019-05-24 17:28:25 · 221 阅读 · 0 评论 -
ALI - 数据研发- 二面 python中正则化的使用
最近被问到了python中正则化的使用,以及如何写出匹配表达式:题目如下:<div class="nam">中国</div>,用正则匹配出标签里面的内容(“中国”),其中class的类名是不确定的答案:import restr1 = '<div class="nam">中国</div>'res = re.findal...原创 2019-05-03 11:36:37 · 567 阅读 · 1 评论 -
ZJTD 大数据研发岗实习远程面试记录
面试官小哥还是很和蔼的1. 简单的自我介绍2. 重点介绍一下你的实习项目之一3. 开始在牛客网上做题如何在一个字符串内找到一个最小字符子串如原始字符串:S = "abcassdwqabcsd"b = "abcd"在S中找包含b的最小子串4. 说说你了解的排序算法,以及他们的思路还有时间复杂度5. 如果有一个2g内存的机器,要对8g数据进行排序,如何操作?...原创 2019-03-25 19:20:35 · 714 阅读 · 0 评论 -
ALI-本地生活-数据研发实习一面
记录一下 数据研发实习 技术面一面内容先自我介绍,然后对着简历让我介绍了自己的做过的一个项目,我在其中的角色;然后问一些算法原理问题:1. 看你提到了VGG的网络结构,请描述CNN由哪些元件构成?他们分别有什么作用?卷积神经网络(CNN)由输入层、卷积层、激活函数、池化层、全连接层组成卷积层 激活函数 池化层 全联接层2. 你了解的激活函数有哪些?他们分别有什么特...原创 2019-04-28 15:09:11 · 334 阅读 · 0 评论 -
Xgboost的原理以及基于python的代码实现
阿里的面试以及DeeCamp的面试中,均问了关于xgboost的原理以及和gdbt等其他数据挖掘方法的对比。原创 2019-07-03 21:29:09 · 1783 阅读 · 0 评论