面了字节跳动的数据挖掘岗，感觉真的很难。。。

最新推荐文章于 2024-07-19 22:46:50 发布

Python数据挖掘

最新推荐文章于 2024-07-19 22:46:50 发布

阅读量984

点赞数 21

分类专栏：机器学习深度学习面试宝典文章标签：数据挖掘人工智能数据分析算法面试

本文链接：https://blog.csdn.net/qq_34160248/article/details/136333642

版权

152 篇文章 81 订阅

订阅专栏

20 篇文章 1 订阅

订阅专栏

18 篇文章 1 订阅

订阅专栏

节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。

基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。

三面的时候网真的好差，中间网络断了很多次，重新发起了4、5次视频面试，最后还是打电话了

【编程题】在一棵二叉排序树中，找到比给定数值小的最大节点。
【场景题】打车的场景下，poi记录了建筑物的坐标：poi(pid, x, y)，odr记录的是乘客上车点的坐标：odr(oid, x, y)；希望对所有的poi，获得其周围的100m的odr：结果(pid, oid)

我开始用的是欧式距离的暴力求解，面试官让我提出优化的方案，我说可以计算出每个坐标点的geohash值，相等的值说明可以建立映射关系，面试官说geohash存在的一个问题是可能会出现两个相邻100m之内的点各自的geohash不同，这时怎么解决？
【SQL题】有两张表：文章分类表artical_cate（aid, cate）一个文章可能有多种类型; 用户阅读表user_read(uid, aid)，一个用户可能阅读多篇文章。
详细问了实习的项目，涉及到业务背景，有哪些特征，整体流程和方法，问到了基于现在这个版本我会怎么继续优化？

总结
编程基础仍然是关键，结合业务场景的问题更需要拓展思路，平时还要多独立思考。
三面由于一道题没做出来，面的不太好，回绝后隔了一段时间后捞我加面

聊天面，问能不能来提前实习，毕业论文，是否有别的offer，导师实验室是否自由等问题

独学而无优则孤陋而寡闻，技术要学会交流、分享，不建议闭门造车。

建立了机器学习算法岗技术与面试交流群，面试真题、答案获取，均可加交流群获取，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友。

方式①、微信搜索公众号：Python学习与数据挖掘，后台回复：交流
方式②、添加微信号：dkl88194，备注：交流

资料

我们打造了《数据分析算法实战案例宝典》，特点：从0到1轻松学习，方法论及原理、代码、案例应有尽有，所有案例都是按照这样的节奏进行表述。
在这里插入图片描述

关注