面试过程中遇到的问题总结(持续更新)

2021年面试回顾:

1. 说说你的职业规划

首先,自己认真思考过这个问题,自己的规划是基于目前的实际情况来设计的,不是凭空想的,自己毕竟刚毕业或者工作时间不长,经验还欠缺。

其次,在工作方面,我打算通过积极完成工作任务,积累各方面的经验,让自己成为这个领域的专业人士,也希望有机会能够带领团队,成为优秀的管理者,为单位做出更大贡献。

第三,在学习方面,打算在专业领域做进一步学习和研究,将实践经验与专业知识相结合,为自己的职业成长做好铺垫,打好基础。谢谢!

参考来源:
作者:职研社De圆圆
链接:https://www.zhihu.com/question/20054953/answer/617412186
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

2. 如何进行特征选择?假设指标选择方差,则每次选择方差大的特征还是方差小的特征?

设计一个启发式函数,每次选择指标最接近目标的。若以方差为指标,则选择方差最大的。
我当时说了选择方差最小的,欠考虑。面试结束才想到:倘若一个特征都为0,方差也就为0,完全没有用了 这个特征等于。

3. 方差计算公式是什么?除以n和除以n-1,谈谈你的理解?

参考

4. 进行PCA之前数据经过了什么操作?

我回答了 数据背景知识获取、数据查看、异常值去除、数据清洗、特征提取、特征选择、数据归一化处理。
##########################################################################
2019年面试回顾:(毕业找工作)

1. C语言中,指针函数和函数指针的区别。

(1) 指针函数是指带指针的函数,即本质是一个函数,函数返回类型是某一类型的指针。
(2) 函数指针是指向函数的指针变量,即本质是一个指针变量。

2. 现有海量日志数据保存在一个超级大的文件中,该文件无法直接读入内存,要求从中提取某天出访问百度次数最多的那个IP。

(1)面试中若题目提到大文件等,其实就是告诉你数据量大,不能一次性加载到内存中,而实际中我们就需要估算。既然是要对访问百度次数的ip做统计,我们最好先预处理一下,遍历把访问百度的所有ip写到另一个文件a中

(2)ip用32位表示,所以最多有2^32个不同ip地址。同样的,当内存不能一次性加载数据时,我们就需要考虑分治法。

step1:采用hash映射(hash(ip)%1000)分别把结果保存到小文件a0…a999中。有人可能会问,这里一定要用1000吗?当然不一定,需要估算,比如若文件a总共320G远远大于4G内存,我们就需要分块(hash映射),若分为1000块,则每块大约300M,再读入内存就没问题了。

step2:可以采用hash_map进行频率统计,找出每个小文件中出现频率最大的IP。对于每一个小文件ai,具体操作如下:创建hash_map,遍历小文件中每条记录。对于每条记录,先在hash_map中搜索,若有,将hash_map中记录count+1,若没有,插入hash_map
step3:在这1000个最大的IP中,找出count最大的ip

3. 线性回归的损失函数是什么?

线性回归的损失函数是平方损失函数,为什么使用平方的形式,
参考:线性回归损失函数为什么要用平方形式,讲得很清楚。
在线性回归中,对于训练数据样本(xi,yi)(xi,yi),我们有如下的拟合直线:
yiˆ=θ⋅xi
yi^=θ⋅xi

构建的损失函数是:
C=∑i=1n(yi−yiˆ)2
C=∑i=1n(yi−yi^)2

表示每一个训练点(xi,yi)(xi,yi)到拟合直线yiˆ=θ⋅xiyi^=θ⋅xi的竖直距离的平方和,通过最小化上面的损失函数可以求得拟合直线的最佳参数θθ。
这里的损失函数之所以使用平方形式,是使用了“最小二乘法”的思想,这里的“二乘”指的是用平方来度量观测点与估计点的距离(远近),“最小”指的是参数值要保证各个观测点与估计点的距离的平方和达到最小。
第二种解释是 极大似然估计误差的思想,暂时没搞明白,先保留。参考:http://blog.csdn.net/saltriver/article/details/57544704

作者:wjlucc
来源:CSDN
原文:https://blog.csdn.net/wjlucc/article/details/71095206
版权声明:本文为博主原创文章,转载请附上博文链接!

4. 线性回归和逻辑回归的区别?

5. L1正则和L2正则的区别?

6. 常见决策树模型有哪些?它们的区别是什么?

7. 如何处理过拟合?

8. 如何处理不平衡数据?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值