题目:设计一个短连接服务,可以将长链接转换为短连接,也可以通过短连接访问目标网站
系统设计的SNAKE 原则:
1.Scenario: 使用场景
非常简单,只有两个功能:
(1)长连接转换为短连接:String shortenURL(String longURL)
(2)短连接转化为长连接,能够访问目标网站: String getLongURL(String shortURL)
2.Necessary:约束条件:
假定网站的日活用户为1million
计算服务(1)的qps:
step1. 使用服务(1)的用户比例为100%
step2. 使用服务(1)的用户,平均使用次数为5
step3. 高峰时段系数:6
step4. 未来三个月用户增长倍数:2
QPS = 1000,000*100%*10*6*2/86400 ≈ 1400
同理,服务(2)的QPS = 1000,000*10%*2*6*2/86400 ≈ 280
结论:以上两个服务qps均在1K量级,并且单个qps计算量并不大,所以单机可以搞定
3. Application/Service: 满足使用场景的应用
3.1 String shortenURL(String longURL)算法:
这里先采用longURL与一个计数器的一一映射来给出它的短连接,比如当前请求的链接是第100个链接,那么可以把它的短连接设为url.cn/100. 非常简单。
数据表的设计:
LongURL | ShortURL |
https://www.baidu.com/s?wd=javascript&ie=utf-8&rsv_cq=intellij+%E5%88%86%E6%9E%90%E6%A0%88&rsv_dl=0_right_recommends_merge_28335&euri=16168 | https://url.cn/100 |
..... | ....... |
3.2 String getLongURL(String shortURL):
就对应数据表的查询。
4. Kilobit 数据量:
一天新增的url:1000,000*10%*2*6*2 = 2,400,000
一天新增的数据量: 假设平均一个longurl占用: 30字符*4Byte/字符 = 120Byte
一个短url占用:4Byte
总数据量为: 2,400,000*124Byte = 284MByte
一年新增数据量: 284*365MB = 100GB
5.Evolve: 优化
5.1 随着url数量不断增加,采用十进制计数会导致短连接变得非常长,比如一年新增的url个数达到10^8个
解决方案:采用[0~9,A~Z,a~z]的62进制代替十进制 log62(10^8) = 5
5.2 如果按顺序递增, 网站一天的用户量会很容被估算出来,而且用户生成的url会被猜出来,就像手机号不是连续的一样
采用随机插入的方式