面试
那offer之前必须要去做的事
北木.
交流分享,共同成长
展开
-
面试之C/C++、Java与Python的区别
1. C++、java和python都是面向对象的编程语言,C是面向过程的 面向过程一般是根据业务逻辑从上到下写代码,一般认为,如果只是写一些简单的脚本,做一些一次性的任务,用面向过程的方式比较好,但如果你需要处理的任务是复杂的,需要不断进行迭代和维护,面向对象更适合。注:面向对象的三大特性:继承、封装、多态2. 垃圾回收机制:C++需要程序要回收,而java和python都有自己的垃圾回收机制3. 字符串比对方法不同: 1). Python中==是判断两个值是否相等 2). Java中原创 2021-04-22 13:55:02 · 1966 阅读 · 0 评论 -
面试之卷积神经网络与全连接神经网络的区别
尽管这一问题比较基础,但仍是面试过程中常问的话题之一 两者之间的唯一区别是神经网络相邻两层的连接方式。在全连接神经网络中,每相邻两层之间的节点都有边相连,而对于卷积神经网络,相邻两层之间只有部分节点相连 正因为二者之间的上述区别,导致全连接神经网络无法很好地处理图像数据,而卷积神经网络却克服了这一缺点,使用全连接神经网络处理图像的最大问题是:全连接层的参数太多,假如输入的一张大小为224∗224∗1224*224*1224∗224∗1的图片(其中,224∗224224*224224∗224.原创 2021-04-14 11:16:29 · 5156 阅读 · 0 评论 -
数据结构常见问题系列(二)
文章目录1. 常用数据结构2. 什么是链表、队列、栈3. 什么是树(平衡二叉树、二叉排序树、B树、B+树、R树、红黑树)1. 常用数据结构1). 数组:顺序存储,随机访问。 链表:链表存储,顺序访问。2). 栈:分为栈顶和栈底,遵循先进后出的原则。3). 队列: 先进先出原则(类比成排队一样)。4). 树:二叉树、平衡二叉树、大、小顶堆等。5). 图:最短路径,关键路径。2. 什么是链表、队列、栈链表: 当需要存储多个相同数据类型的时候,可以使用数组存储,数组可以通过下标直原创 2020-11-06 11:17:05 · 1668 阅读 · 0 评论 -
数据结构常见问题系列(一)
文章目录1. 数组和链表的区别2. 简述快速排序3. 排序算法对比4. 稳定性5. 用循环比递归效率高吗?6. 解决哈希冲突的方法7. KMP算法8. B树1. 数组和链表的区别 1). 从逻辑结构来看,数组必须固定长度,数据不能动态增减,即数组的大小一旦定义就不能改变。当数据增加时,可能超过原先定义的元素的个数;当数据减少时,造成内存的浪费;链表动态进行存储分配,可以适应数据动态地增减的情况,且方便地插入、输出数据项。 2). 从内存存储的角度看,数组从栈中分配空间,对程序员方便快速,但是自原创 2020-11-03 22:56:26 · 3111 阅读 · 0 评论 -
面试小技巧,你有get到吗?
搜贴牛客网,然后结合自己的所感,分享此文,期待交流补充哈 :)1. 自我介绍每个人情况不同,简单说一下大家一般认可的思路吧。面试官好,我是xx大学xx专业硕士应届毕业生xx(名字)。今天应聘xx职位。我认为我的优势在于xx方面,在校学习期间…;另外作为负责人或者重要的参与人参与了一些省级和国家级的项目和比赛(或者开源项目),积累沉淀了一些专业方面的学习经验和方法,收获了很多东西;最后我比较喜欢xx(运动),平时通过足球来排解学习压力并同时锻炼身体。以上基本就是我的自我介绍,谢谢各位面试官。原创 2020-10-21 16:47:57 · 178 阅读 · 0 评论 -
小米2019算法
1. 定义数组int A[6][9],若将其作为参数传入方法中,则对应的形参可以定义为 ADA int(*s)[9]B int *s[9]C int D[6][]D int D[][9]2. 激活函数需要具备的属性:1. 非线性 2. 几乎处处可微 3. 计算简单 4. 非饱和性 5.单调性 6. 输出范围有限 7. 接受恒等变换 8. 参数少3. 以下哪些函数是凸函数?()A. f(x) = xB. f(x) = x3C. f(x) = x4D. f(x) = x3+x4原创 2020-09-08 14:46:42 · 607 阅读 · 0 评论 -
魔法师四种元素平衡(Python)
题目描述《XX魔法书》中记载,只有魔法师体内地火水风四种元素平衡的时候才是绝对安全的。某魔法师在给自己做了一个体检,发现自己体内的四种元素数量分别是A,B,C,D,魔法师慌了,这时他看到魔法书中记载了一种转换魔法,可以把任意两个单位的元素转换成任意一种元素。输入描述输入仅包含一行,仅包含4个正整数A,B,C,D,分别表示四种元素的数量。(1<=A,B,C,D<=10^17)输出描述输出仅包含一个整数,如题所示样例输入1 2 2 4样例输出8提示:只要把第四种元素中的两个转换为转载 2020-08-26 21:59:41 · 1861 阅读 · 0 评论 -
百度2019校园招聘 —— 机器学习/数据挖掘/自然语言处理部分题
部分题目已经在博文中作答,详情点击 百度 2019校园招聘 计算机视觉算法研发工程师1. 下列关于语言模型的说法错误的是() BA 基于知识的语言模型通过非歧义的规则解释歧义过程B 基于知识的语言模型是经验主义方法C 基于语料库的统计分析模型需要从大规模的真实文本中发现知识D 基于语料库的统计模型更加注重用数学的方法2. 下列关于现有的分词算法说法错误的是() AA 基于统计的分词方法是总控部分的协调下,分词子系统获得有关词、句子等的句法和语义信息来对分词歧义进行判断B 由于在上下文中,相原创 2020-08-22 15:33:46 · 1490 阅读 · 0 评论 -
华为研发工程师编程题 : 进制转换
题目描述:写出一个程序,接受一个十六进制的数,输出该数值的十进制表示。(多组同时输入 )输入描述: 输入一个十六进制的数值字符串。输出描述: 输出该数值的十进制字符串。输入例子1: 0xA输出例子1: 10代码:# include<iostream>using namespace std;int main(){ int a; while(cin >> hex >> a){ cout << a <<原创 2020-08-22 09:30:37 · 184 阅读 · 0 评论 -
华为研发工程师编程题 : 明明的随机数
题目描述:明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从小到大排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)。Input Paramn 输入随机数的个数inputArray n个随机整数组成的数组原创 2020-08-22 09:17:23 · 328 阅读 · 0 评论 -
华为研发工程师编程题:汽水瓶
题目描述:有这样一道智力题:“某商店规定:三个空汽水瓶可以换一瓶汽水。小张手上有十个空汽水瓶,她最多可以换多少瓶汽水喝?”答案是5瓶,方法如下:先用9个空瓶子换3瓶汽水,喝掉3瓶满的,喝完以后4个空瓶子,用3个再换一瓶,喝掉这瓶满的,这时候剩2个空瓶子。然后你让老板先借给你一瓶汽水,喝掉这瓶满的,喝完以后用3个空瓶子换一瓶满的还给老板。如果小张手上有n个空汽水瓶,最多可以换多少瓶汽水喝?输入描述:输入文件最多包含10组测试数据,每个数据占一行,仅包含一个正整数n(1<=n<=100),表示原创 2020-08-21 23:11:07 · 369 阅读 · 0 评论 -
华为2019网络挑战赛初赛网络方向部分模拟题及答案
Iass(基础设施即服务)、Pass(平台即服务)、Sass(软件即服务)1. 以下哪项用来确定路由优先级?(A)A. 路由协议算法的优劣B. 到目标网络的跳数C. 发送接口的带宽D. 物理链路的可靠性2. 华为公司将网络和业务安全性保障的责任和公司的商业利益放在同等重要的位置。(False)3. 下列选项中,哪一项属于大数据的核心?(B)A. 告知与许可B. 预测C. 匿名化D. 规模化4. 下列选项中,哪个选项是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构?(原创 2020-08-21 17:05:52 · 2655 阅读 · 0 评论 -
百度 2019校园招聘 计算机视觉算法研发工程师
1, 对任意数列进行排序时,平均排序时间最短的排序算法为 AA 快速排序B 堆排序C 归并排序D 插入排序2. 下列编译方法中,属于自底向上语法分析法有哪些 CDA 递归下降分析B 预测分析法C 算符优先分析法D LR(K)分析3. 给定文法G[E]:E→E+E|E*E|id(id表示任意小写字母),下列表达式合法的是 DA a*(b+c)B a-(b+c)C a-b-cD a+b*c4. 设一个栈的输入序列为1,2,3,4,5, 6,则借助一个栈所得到的输出原创 2020-08-21 15:31:42 · 858 阅读 · 0 评论 -
百度2019计算机视觉题目问答题
关于K-means聚类算法,请回答以下问题:K-means是有监督聚类还是无监督聚类?(2分)写出将N个样本(X=(x1,…,xN))聚成K类的K-means聚类算法的优化目标函数。(6分)请用伪代码写出聚类过程。(8分)假设样本特征维度为D,请描述Kmeans算法时间复杂度。(4分)参考答案:无监督对于样本xix_ixi,计算其分类:ci=argmin∥xi−uj∥2c_{i}=\operatorname{argmin}\left\|x_{i}-u_{j}\r原创 2020-08-19 10:17:59 · 1070 阅读 · 0 评论 -
阿里算法工程师重点题整理
1.设x、y、t均为int型变量,则执行语句:t=3; x=y=2; t=x++||++y; 后,变量t和y的值分别为____。A t=1 y=2 B t=1 y=3 C t=2 y=2 D t=2 y=3 E t=3 y=2 F t=3 y=3思路:x++||++y执行后的结果是真,即1,然后赋值给t。因为是或运算,所以在判断x++是真后,后面的++y就不再执行了,所以y值没有变还是2。正解A2.以下是一个有向图,我们从节点B开始进行深原创 2020-08-18 14:16:48 · 587 阅读 · 0 评论 -
京东面试算法题
1. 若一序列进栈顺序为a1,a2,a3,a4,问存在多少种可能的出栈序列12131415正确答案:Cf(n)=C(2n,n)/(n+1)2. 下列属于有监督学习算法的是:谱聚类主成分分析PCA主题模型LDA线性判别分析LDA正确答案:D题目解析: 聚类是典型的无监督学习方法,谱聚类是很好的聚类算法,往往可以得到不错的聚类结果(缺点是需要计算特征值和特征向量,速度较慢);主成分分析PCA是使用无标签的数据直接做降维,属于无监督学习。主题模型LDA只使用文本数据本身,在给定主题原创 2020-08-17 22:48:03 · 2042 阅读 · 0 评论 -
机器学习 精准率 — 召回率 — 准确率 — F1-Score
准确率 、召回率 、精确率 :准确率->accuracy, 精确率->precision. 召回率-> recall. 三者很像,但是并不同,简单来说三者的目的对象并不相同。大多时候我们需要将三者放到特定的任务环境中才会更加明显的感觉到三者的差异。在介绍这些之前,我们先回顾一下我们的混淆矩阵。True Positive(真正, TP):将正类预测为正类数.True Negative(真负 , TN):将负类预测为负类数.False Positive(假正, FP):将负类预测为原创 2020-08-17 22:08:43 · 1139 阅读 · 0 评论 -
京东测试算法工程师岗位笔试错题、重点题总结
1. 在C++中,引用和指针的区别是()A. 引用总是指向一个对象,指针可能不指向对象B. 引用和指针都可以被重新赋值C. 引用不能用const修饰,而指针可以D. 引用创建时必须初始化,而指针则可以在任何时候被初始化ACD2. 关于软件测试说法不正确的是A. 测试虽然也与开发过程紧密相关,但关心的不是过程的活动,而是对过程的产物以及开发出的软件进行剖析。B. 软件测试只能证明一个软件存在缺陷,却不能证明一个软件没有缺陷。C. 软件测试是为了寻找软件的缺陷和错误,提高软件的质量和交付频率原创 2020-08-17 17:27:42 · 529 阅读 · 0 评论 -
Python中的sort()和sorted()的区别
L.sort() 函数只适用于列表排序,而sorted()函数适用于任意可以迭代的对象排序。L.sort() 函数排序会改变原有的待排序列表,而sorted()函数则不会改变。所以在使用列表进行排序时,需要考虑是否需要保存原列表,如果无需保存原列表,则优先使用L.sort() 节省内存空间,提高效率。两个函数通过定义 key 和 cmp 都可以完成排序,但是 key 的效率要远远高于 cmp,所以要优先使用 key 。...原创 2020-08-02 10:24:40 · 496 阅读 · 0 评论 -
高效刷leetcode
最近刚拿到几个offer(非算法岗),我是从0开始刷的,差不多刷了三个月,基本上刷的都是高频题,有很多都是面试过程中被问到的,分类也都是站在面试角度自己挨道题分的,建议从0开始的可以直接按我的来。GitHub:https://github.com/yuanguangxin/LeetCodegithub.comLeetCode题目分类Hash相关q1_两数之和链表操作q2_两数相加q19_删除链表的倒数第N个节点q61_旋转链表q138_复制带随机指针的链表q206_反转链表双指针遍历/滑动窗口q3_无重复转载 2020-07-25 15:45:08 · 207 阅读 · 2 评论 -
华为2016校园招聘上机笔试题 —— 最高分是多少
题目描述: 老师想知道从某某同学当中,分数最高的是多少,现在请你编程模拟老师的询问。当然,老师有时候需要更新某位同学的成绩.输入描述: 输入包括多组测试数据。每组输入第一行是两个正整数N和M(0 < N <= 30000,0 < M < 5000),分别代表学生的数目和操作的数目。学生ID编号从1编到N。第二行包含N个整数,代表这N个学生的初始成绩,其中第i个数代表ID为i的学生的成绩接下来又M行,每一行有一个字符C(只取‘Q’或‘U’),和两个正整数A,B,当C.原创 2020-07-24 16:04:03 · 722 阅读 · 1 评论 -
面试被问:你了解的海康威视是一家怎样的公司?
声明由于该内容涉及公司形象,若所言有疑,烦请指正。 海康主业是做安防方面,拥有业内领先的自主核心技术和可持续研发能力,提供摄像机/智能球机、光端机、DVR/DVS/板卡、BSV液晶接拼屏、网络存储、视频综合平台、中心管理软件等安防产品,并针对金融、公安、电讯、交通、司法、教育、电力、水利、军队等众多行业提供合适的细分产品与专业的行业解决方案。海康在全国安防领域排第一,非常有实力。https://www.nowcoder.com/discuss/362751?type=2&order=4&am原创 2020-07-23 21:35:23 · 7070 阅读 · 0 评论 -
面试之前,你不可不知的事
offershow网站或者公众号上是能够查到工资的,给你自己提供一个价位参考。 在邮件里简单描述了自己的工作经历以及**对这个岗位的一些优势。**在投递了大概两三天之后,我就收到了简历通过筛选,让我一面的通知。 面试官问我我看你简历上面写你发了文章,你发的哪里的?什么层次?关于哪个领域?影响因子怎么样?然后面试官问你了解自己面试的岗位吗 项目的核心在哪?难点在哪?为什么这点比较难?在做项目的过程中有没有遇到大的问题?你是怎么解决这些问题的?解决问题大概用了多久?...原创 2020-07-23 21:06:06 · 121 阅读 · 0 评论 -
商汤科技面经整理
来源于牛客网各位热心网友的分享,整理了主要适用于人工智能方向经验之谈。非技术类:1. 针对可能出现的工作环境提出解决方案2. 假设和研发在思路上有冲突,会怎么解决?说一下你的方法。 一切为了整体进度和工作效果考虑,经常做利弊权衡,首先进行思考,与研发进行深入沟通,先坚持,如果对方也坚持,而我经过利弊权衡之后认为弊端并不比优势大,那么我会妥协。3. 你的优点和缺点是什么? 多年理工科训练造成的逻辑能力,拆分问题,从大化小,习惯性考虑多种情况;学习能力,同时处理很多事情,同时取得不错的成绩,可原创 2020-07-22 08:48:43 · 4799 阅读 · 2 评论 -
常见的深度学习面试题及解答(三)
往期回顾 常见的深度学习面试题及解答(一)常见的深度学习面试题及解答(二) 1. 怎样提升网络的泛化能力? 从数据上提升性能:收集更多的数据,对数据做缩放和变换,特征组合。从算法调优上提升性能:用可靠的模型诊断工具对模型进行诊断,权重的初始化,用小的随机数初始化权重。对学习率进行调节,尝试选择合适的激活函数,调整网络的拓扑结构,调节batch和epoch的大小,添加正则化的方法,尝试使用其它的优化方法,使用早停法。 2. 什么是 seq2seq model? seq2seq属于e.原创 2020-07-14 21:53:19 · 544 阅读 · 0 评论 -
排序算法第一讲 --- 冒泡排序(Python、C++、C、java)
题目描述: 给你一个整数数组 nums,请你将该数组采用冒泡方式进行升序排列。 解题思路: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。针对所有的元素重复以上的步骤,除了最后一个。持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。 代码: Python写法:class Solution(object): def solution(.原创 2020-07-05 15:03:26 · 425 阅读 · 0 评论 -
面试之C语言基础算法系列(一)
前沿 著名计算机科学家沃思(Nikiklaus Wirth)提出一个公式: 算法 + 数据结构 = 程序 基础算法是面试中必须要克服的障碍,因此,开始基础算法系列的旅程吧! 算法之旅 1. Fibonacci数列 [1]. 快乐的LeetCode — 面试题10- I. 斐波那契数列[2]. 剑指offer面试题09----斐波拉契数列 2. 回文检查 给出的数在逆序后可能超过int范围,可以赋值给long后再逆序。#include <stdio.h>int mai.原创 2020-06-01 16:54:07 · 430 阅读 · 0 评论 -
中兴面试经验之谈(结合自己与网上的面经)
前言 各位伙伴,本篇博客将结合自己并引用各位博主的经验持续更新。争取尽可能为大家提供一篇高质量的中兴面经。 经验交流 经验1: 跳槽去中兴的一位朋友,给中兴的几个部门投了简历,最终收到了两个面试通知,在前面部分面试挂掉之后,收到了后面部门的面试通知,可由于自己技术广泛而不精,最终留下遗憾。经验2:先回忆一下技术面和综合面:技术面:1.自我介绍;2.讲一下你的论文吧,3.你这两篇论文的区别是什么?4.你了解5G吗?讲一下你对5G的了解。5.你的专业是什么?6.你有什么想问我们.原创 2020-05-30 17:51:31 · 20514 阅读 · 0 评论 -
有史以来最强的 5G 入门科普!
(给程序员的那些事加星标)转自:鲜枣课堂(ID:xzclasscom) 一个简单且神奇的公式 今天的故事,从一个公式开始讲起。这是一个既简单又神奇的公式。说它简单,是因为它一共只有3个字母。而说它神奇,是因为这个公式蕴含了博大精深的通信技术奥秘,这个星球上有无数的人都在为之魂牵梦绕。这个公式,就是它——我相信很多同学都认出这个公式了,如果没认出来,而且你又是一个理科生的话,请记得有空多给你的中学物理老师打打电话!解释一...转载 2020-05-28 16:06:43 · 232 阅读 · 0 评论 -
常见的深度强化学习面试题及解答(持续更新ing)
1. 不打破数据相关性,神经网络的训练效果为什么就不好? 在神经网络中通常使用随机梯度下降法。随机的意思是我们随机选择一些样本来增量式的估计梯度,比如常用的采用batch训练。如果样本是相关的,那就意味着前后两个batch的很可能也是相关的,那么估计的梯度也会呈现出某种相关性。如果不幸的情况下,后面的梯度估计可能会抵消掉前面的梯度量。从而使得训练难以收敛。 2. DQN都有哪些变种?引入状态奖励的是哪种? DQN三个经典的变种:Double DQN、Dueling DQN、Prioritized.原创 2020-05-25 22:11:08 · 1111 阅读 · 0 评论 -
暑期实习面经(NLP 方向)达摩院、腾讯、微软、美团、百度
本人情况:双非本末流985研二,爱奇艺 NLP 日常实习经历,无论文,投的都是 NLP 算法岗。 目前到手:微软、腾讯,应该是选微软了吧 阿里达摩院(挂) 一面(45分钟) 上来面试官介绍他们组情况,问我有什么想问的?我有点懵逼,这不是一般最后的环节吗。 问研究生期间的研究方向; 研究内容有提到 DSSM,询问是否知道现在对 DSSM 的改进模型,回答不知,现在更多做的生成模型,因此问题转到生...转载 2020-04-23 09:34:07 · 1817 阅读 · 0 评论 -
10年后,阿里给千万开源人写了一封信
简介: 年末将至,阿里巴巴开源技术委员会负责人贾扬清写了一封信,想要和热爱开源的你说一声:谢谢。未来,我们希望与更多开源人一起,用技术普惠世界。当我们回想起为什么做开源的时候,也许理由都没有那么的高大上:也许就是单纯想分享一下代码,也许就是觉得社区很有意思,甚至也许不知道什么原因,代码放出去了,有人用...转载 2020-04-21 09:22:32 · 119 阅读 · 0 评论 -
BAT机器学习面试系列(一)
1. 请简要介绍下tensorflow的计算图 Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个节点都是计算图上的一个Tensor, 也就是张量,而节点之间的边描述了计算之间的依赖关系(定义时)和数学操作(运算时)。如下图表示:a=x*y; b=a+z; c=tf.reduce_sum(b)...原创 2020-04-20 21:09:30 · 145 阅读 · 0 评论 -
常见的机器学习面试题及解答(二)
往期回顾常见的机器学习面试题及解答(一)1. 请你谈一下对于SGD,Momentum,Adagard,Adam原理的认识SGD随机梯度下降,与数据集的batch有关。Momentum梯度指数衰减。Adagarm可自动变更学习率。Adam每次迭代后的学习率有个确定的范围。...原创 2020-04-17 11:40:32 · 294 阅读 · 0 评论 -
为什么校招面试中“线程与进程的区别”老是被问到?我该如何回答?
进程与线程?(Process vs. Thread?)面试官(正襟危坐中):给我说说“线程”与“进程”吧。我(总是不太聪明的样子):“限乘?”、“进什么城(程)?”面试官:“操作系统中的进程与线程,你回去了解一下。门在左边,记得关门。”当翻译过来后,这两个概...转载 2020-04-13 15:50:21 · 319 阅读 · 0 评论 -
常见的深度学习面试题及解答(二)
往期回顾 深度学习100问常见的深度学习面试题及解答(一) 1. 在深度学习中,通常会finetuning (微调) 已有的成熟模型,再基于新数据,修改最后几层神经网络权值,为什么? Deep Learning或者说CNN在图像识别这一领域取得了巨大的进步,那么自然我们就想将CNN应用到我们自己的数据集上,但这时通常就会面临一个问题:通常我们的dataset都不会特别大,一般不会超...原创 2020-04-12 11:56:34 · 793 阅读 · 0 评论 -
深度学习100问
目录● BatchNormalization的作用● 梯度消失● 循环神经网络,为什么好?● 什么是Group Convolution● 什么是RNN● 训练过程中,若一个模型不收敛,那么是否说明这个模型无效?导致模型不收敛的原因有哪些?● 图像处理中锐化和平滑的操作● VGG使用3...转载 2020-04-12 11:49:10 · 2402 阅读 · 0 评论 -
常见的强化学习面试题及解答(持续更新中ing)
1. 请你讲一下,HMM隐马尔可夫模型的参数估计方法是什么? 学习算法:若训练数据包括观测序列和状态序列,则HMM的学习非常简单,是监督学习;若训练数据只有观测序列,则HMM的学习需要使用EM算法,是非监督学习。大数定理: 假定已给定训练数据包含S个长度相同的观测序列和对应的状态序列{(O1,I1), (O2,I2)…(OS,IS)},那么,可以直接利用伯努利大数定理的结论:频...原创 2020-04-07 22:59:24 · 10548 阅读 · 1 评论 -
常见的大数据面试题及解答
1. 请你简要描述一下,XGBOOST和GDBT的区别是什么 xgboostgdbt本质上机器学习算法的具体工程实现机器学习算法的一种基分类器基分类器可以是线性的采用cart作为基分类器防止过拟合在目标函数中显式的加入了正则化项来控制模型的复杂度数据的使用可以对数据进行采用每轮迭代都使用全部数据对缺失值处理可以自动学习出缺失值的分...原创 2020-04-05 11:34:29 · 311 阅读 · 0 评论 -
面试之雇佣员工与员工过生日问题
问题: 某大公司有这么一个规定:只要有一个员工过生日,当天所有员工全部放假一天。但在其余时候,所有员工都没有假期,必须正常上班。这个公司需要雇用多少员工,才能让公司一年内所有员工的总工作时间期望值最大?( 假设一年有 365 天,每个员工的生日都概率均等地分布在这 365 天里。) 你的第一感觉或许是,公司应该雇用 100 多人,或者 200 多人吧。答案或许会让你大吃一惊:公司应该雇...转载 2020-04-01 22:55:07 · 900 阅读 · 1 评论