【38】阿里面试官常问:如何设计与实现短连接 URL 服务?

本文介绍了短URL服务的基础原理,包括长URL到短URL的转换过程,并详细讨论了服务设计,如如何保证对应关系存储、实现一一对应、短URL存储优化以及应对高并发和分布式场景的策略。此外,还分享了实际实现时的部分代码实现细节。
摘要由CSDN通过智能技术生成

 为什么这里面的url都是短的呢?有什么好处呢?怎么做到的呢?

短url的好处有:

1、短. 短信和许多平台(微博)有字数限制,太长的链接加进去都没有办法写正文了.

2、好看. 比起一大堆不知所以的参数,短链接更加简洁友好.

3、方便做一些统计.你点了链接会有人记录然后分析的.

4、安全. 不暴露访问参数.

这就是为什么我们现在收到的垃圾短信大多数都是短URL的原因了.

那么短URL是怎么做到的呢?

短URL基础原理

短URL从生成到使用分为以下几步.

1、有一个服务,将要发送给你的长URL对应到一个短URL上.

例如www.baidu.com -> www.t.cn/1

2、把短url拼接到短信等的内容上发送.

3、用户点击短URL,浏览器用301/302进行重定向,访问到对应的长URL.

4、展示对应的内容.

本文主要集中于第一步,即如何将一个长URL对应到短URL上.

服务设计

如果你在往长短URL真实的对应关系上想,那么就走远了.

最理想的情况是: 我们用一种算法,对每一个长URL,唯一的转换成短URL.还能保持反向转换的能力.

但是这是不可能的,如果有这样的算法,世界上的所有压缩算法都可以原地去世了.

正确的思路是建立一个发号器,每次有一个新的长URL进来,我们就增加一,并且将新的数值返回.第一个来的url返回"www.x.cn/0",第二个返回"www.x.cn/1".

接下来以QA形式写几个小问题:

1、对应关系如何存储?

这个对应数据肯定是要落盘的,不能每次系统重启就重新排号,所以可以采用mysql等数据库来存储.而且如果数据量小且qps低,直接使用数据库的自增主键就可以实现.

2、如何保证长短链接一一对应?

按照上面的发号器策略,是不能保证长短链接的一一对应的,你连续用同一个URL请求两次,结果值都是不一样的.

为了实现长短链接一一对应,我们需要付出很大的空间代价,尤其是为了快速响应,我们可以需要在内存中做一层缓存,这样子太浪费了.

但是可以实现一些变种的,来实现部分的一一对应, 比如将最近/最热门的对应关系存储在K-V数据库中,这样子可以节省空间的同时,加快响应速度.

3、短URL的存储

我们返回的短URL一般是将数字转换成32进制,这样子可以更加有效的缩短URL长度,那么32进制的数字对计算机来说只是字符串,怎么存储呢?直接存储字符串对等值查找好找,对范围查找等太不友好了.

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值