它来了,腾讯爸爸带着「手撕编程」来了……ʕ •ᴥ•ʔ
秋招第一场面试 —— 腾讯爸爸。
- 岗位方向
软件工程 - 数据分析 - Job Description
https://join.qq.com/post.php?post=191&pid=1 - 批次
2020秋招提前批第一轮面试
❤️ 「更多秋招经验贴」
一、面试问题
- 自我介绍
- 选一两个项目说说吧。具体的过程,和结论。
我其中一个项目是关于用户画像的数据分析,追问:为什么想到做这个的?
(总结:介绍项目的步骤:背景目的 - 过程 - 结论 - 应用场景/贡献)
- 项目过程中遇到什么困难?
我说反爬虫。
追问:那你怎么解决的?
我:emmm……
(总结:回顾项目的时候,我忘记提前准备遇到的困难和解决方法。其实我有解决其他困难的更好的例子。但是面试过程一下子想不起来。给自己挖了一个反爬虫的坑……)
-
指出我的项目中,样本量不够大,问有什么影响?
我答:不准确,有偏差,代表性不够。
追问:那怎么衡量这个偏差?
我:emmmm……???(欢迎大佬评论指点) -
针对我的用户画像的项目,问细节,我的特征构造是否合理,为什么想要构造这个变量?
提出另外一种做法,问和我的相比,哪个更好,有什么影响? -
我特征工程中,有几个衍生变量是用平均数构造的。追问,为什么用平均数,不用中位数?
追问:平均数和中位数的区别?
我答:分布均匀用平均数,如果偏态用中位数更合理。 -
追问:如何判断分布是偏态的?
我答:用pp-plot
面试官:emmm……
我继续答:画柱状图,拟合密度曲线判断。
面试官:emmm…… 用数字来判断呢?
我:啊。判断平均值和众数的关系。如果两者相等,近似正态。如果众数大或小于平均数,都是有偏的。
面试官:emmm…… 我们换个问题吧。
(求大佬评论指点。他到底想听到啥啊。) -
说说文本分析。
(我没复习到,忘了…… 该打) -
还是针对用户画像的project,追问,我是如何给用户“贴标签”的,具体过程。
-
实习参与了什么项目。说说看。
-
数据清洗过程?
-
编程题 —— 圆桌会议。
详见 《腾讯2020校园招聘数据分析(提前批)面试编程题 | 圆桌会议 「约瑟夫环」(2019.8.7)》 -
你现在在哪里?
我:我在星巴克啊~
面试官:emmm……我是说,你在深圳吗?
我:…… -
你还有什么问题?
二、总结
- 紧紧围绕简历的实习和项目经验展开,问的很详细,很具体。
- 没问业务,没问SQL,考察Python。
- 个人不足:
1)准备项目的 「困难和解决方法」实例;
2)求问大佬:怎么衡量由于样本量不足带来的偏差?
3)求问大佬:如何判断分布是偏态的?除了pp-plot,柱状图、均值和众数关系的比较。详见第7问。
4)补文本分析
5)补算法 —— 约瑟夫环。