百度的两道笔试题

最新推荐文章于 2019-09-11 11:26:22 发布

macrossdzh

最新推荐文章于 2019-09-11 11:26:22 发布

阅读量1k

点赞数

分类专栏：其它文章标签：百度服务器数据结构 hashmap server url

本文链接：https://blog.csdn.net/macrossdzh/article/details/5933013

版权

其它专栏收录该内容

14 篇文章 0 订阅

订阅专栏

一. 每个url 包括site 跟path两部分。site就是比如 www.baidu.com path就是http://www.baidu.com/s?wd=%D7%D6%B7%FB%B4%A 后面那部分。要实现方便查询更新等。同时若干服务器分别位于不同地区。
要求
1.删除、更新url,可以不实时性
2. 根据url可以找出存储位置
3. 可以找出所有site的path

要求实现上述系统，提示：url可以是分布存储的。

二. 设计一个服务调度管理器，服务器接收数据包，
数据包大小为32个字节，第一个字节是请求的优先级，后面31个字节是请求的命令，服务器根据客
户端发来的命令，分配资源，完成相应的服务，然后将操作的结果返回给客户端，但是由于服务器资源有限，故服务器可以存储操作的结果，如果下次有同样的命令
到来的时候，直接获取操作结果返回给客户端即可。
要求设计一个服务器调度管理器，满足以下调度条件：
（1）同样条件下，请求次数多的请求首先获得服务，请求次数最大255
（2）同样条件下，请求优先级高的请求首先获得服务，优先级等级最高16.
要做的是：
（1）设计服务器的核心调度算法：
（2）数据结构设计
（3）如果服务器的记录容量是20万条，分析需要占用多大内存空间？？

总结一些网上的回答：

第一题：

Server Pool: [ svr1, svr2, svr3, .....svrN]
用site和服务器的数目做hash，比如
hash key(site)%N

然后url爱怎么折腾都行。

如果需要, 可以把Server Pool的数目增大(pool中可以对Server进行重用)

这就是SLB

第二题：

一种回答

数据结构，请求的调度使用链表数组（数组的每个节点指向链表，数组长度为16）来管理，操作结果使用哈希表来缓存（与请求的命令对应上）。
同一优先级的请求放在链表数组的相应节点的链表中，第一个字节改为存放请求次数（初始化为1），从前向后遍历链表，如果已经有同样的请求在链表中，则把这个请求的请求次数加1，并与它前面的节点比较，如果请求次数比前面的大，则向前移；如果没有同样的请求，则放在链表末尾。

另一种回答

关键是实现一个ExpiringMap，一个会维护本身容积的HashMap，内部会有一个线程定期检查请求率最低的命令将会被删除，以保证容器是在规定的大小内。ExpiringMap的key就是命令本身，值是包含命令请求数目和请求结果的对象，在每次返回结果后将会更新该Map。

还有就是实现一个PriorityQueue，实现可以参考jdk的源码，如果用jdk的PriorityQueue的话就只需要实现Comparator接口，该接口可以根据比较先检索ExpiringMap有无该命令，没有的话在比较请求的第一个字节确定命令的优先级。

所以会有一个线程负责监听请求，来了请求就放入到PriorityQueue这个队列中，插入的顺序是按照Comparator接口定义的顺序。然后会有另一个线程负责处理请求，每次从队列中取走第一个元素进行处理，如果在ExpiringMap中有该命令，直接取出结果返回。

一个哥们的总结：

原理性问题
基本百度的题一定要以随机访问一定要哈希表, 排序一定上快排, 查找一定要二分, 强连通分量一定要用 Tarjan 算法, 动规一定比穷举好这几种为底来扩展延伸回答