百度第三面失败经历

最新推荐文章于 2022-04-18 16:33:19 发布

u012868405

最新推荐文章于 2022-04-18 16:33:19 发布

阅读量1.3k

点赞数 1

分类专栏：经验教训面试文章标签：百度面试位图2016校招

本文链接：https://blog.csdn.net/u012868405/article/details/49761113

版权

经验教训同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

面试

1 篇文章 0 订阅

订阅专栏

2015年10月17日，周六，下午两点半左右，参加了百度校园招聘的面试，软开C++方向。一面问的都是CS专业的基础问题，二面考察的较多基础编程，对C++基础的掌握程度，并要求现场写代码，还有些基本的数据结构操作等，三面问的是考察思维和对知识运用能力的题。在此记录三面的失败经历，以示后训。

设计题：

有一个数据库，存储有上亿的记录，每个记录都是用户搜索的关键词（假设所有关键词都是英文），现在要求给定一个单词（word），从数据库中找出所有相似的单词。此处相似单词的定义为：对单词A和单词B，分别删除它们所组成的字母序列中的重复字母（每个出现过的字母仅保留一个），如果两个单词删除之后的结果中，所包含的字母个数及种类相同，则认为单词A和B相似，否则不相似。

我的失败的思路：

对数据库中的单词进行预处理，生成一个key，用于检索。具体预处理过程如下：对任一单词W，去除其包含的重复的字母，然后对去重之后的结果中的字母按字母表顺序重新排列，生成中间单词W‘，这样所有相似单词W1，W2...它们的中间单词都是W'。然后对中间单词W'进行哈希，生成唯一的，等长度的一个值，即key。

此处考官问我，你怎么去确定这个哈希函数？给个具体的方案。

我试着回答几次，都不能另考官满意，之后便放弃了。

现在想到的较好的解决办法：

还是预处理，第一步还是去重，此时所有单词产生的中间结果最多有26个字母。将中间结果所包含的字母划归为一个集合，因而集合的所有可能为2^26种。我们可以根据这样的一个集合唯一确定一类相似的单词，现在的问题就是如何表示这样的集合。今天偶尔看到位图表示时才恍然大悟，其实在这里我对每一类相似单词的集合只需要4个字节就能唯一地表示它了，具体方法是：对于集合中出现的字母，在4字节变量key的对应位上置1，没有出现的字母则key的对应位置0 。So easy，可惜想出来得太晚了。

此次失败的经历暴露出我基础不够扎实的问题，亟需改正。

u012868405

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
百度第三面失败经历

2015年10月17日，周六，下午两点半左右，参加了百度校园招聘的面试，软开C++方向。一面问的都是CS专业的基础问题，二面考察的较多基础编程，对C++基础的掌握程度，并要求现场写代码，还有些基本的数据结构操作等，三面问的是考察思维和对知识运用能力的题。在此记录三面的失败经历，以示后训。设计题：有一个数据库，存储有上亿的记录，每个记录都是用户搜索的关键词（假设所有关键词都是英文），
复制链接

扫一扫

专栏目录