URL是Uniform Resource Locator的缩写,即统一资源定位符,也就是我们通常所说的网址。为了便
于理解,我们将url简化成如下的形式,以www.baidu.coms?wd=baidu为例,www.baidu.com称为site,后
面的部分成为path。每条url都有一些对应的属性,分为定长的属性(如url被系统发现的时间)和不定长
的属性(如描述url的文字)。
请设计一个系统。
要求:
1、存储和维护100亿url 及其属性
2、实现url及其属性的添加、更新和删除(不需要实时)
3、给定一批url、判定是否在系统中,如果在系统中,需要得到它的信息
4、快速选出一个站定下的所有url及其属性信息
提示:总体url数量巨大,所以有必要吧url的存储以及相关的计算分布在多台机器上完成。
于理解,我们将url简化成如下的形式,以www.baidu.coms?wd=baidu为例,www.baidu.com称为site,后
面的部分成为path。每条url都有一些对应的属性,分为定长的属性(如url被系统发现的时间)和不定长
的属性(如描述url的文字)。
请设计一个系统。
要求:
1、存储和维护100亿url 及其属性
2、实现url及其属性的添加、更新和删除(不需要实时)
3、给定一批url、判定是否在系统中,如果在系统中,需要得到它的信息
4、快速选出一个站定下的所有url及其属性信息
提示:总体url数量巨大,所以有必要吧url的存储以及相关的计算分布在多台机器上完成。