一、背景
现在在各种圈的产品各种推广地址,由于URL地址过长,不美观、不方便收藏、发布、传播以及各种发文字数限制等问题,微信、微博都在使用短链接技术。最近由于使用的三方的生成、解析短链接服务开始限制使用以及准备收费、不方便统计分析、不方便流控等问题,决定自建一个短地址服务。
二、原理
比如,http://dx.*.com/15uOVS 这个短地址
第1步,浏览器请求这个地址
第2步,通过DNS后到短地址服务端,还原这个短地址对应的原始长地址。
第3步,请求http 301 或302到原始的长地址上
第4步,浏览器拿到原始长地址的响应response
三、实现
短地址服务的核心是短地址和长地址的转化映射算法。
最简单的算法是把原来的长地址做MD5摘要记为key,长地址记为value。把key value放入服务端缓存中比如redis中。
反向解析时通过URL解决出key来,比如上面的短地址key = 15uOVS 。然后通过key去缓存中获取原始长地址value实现URL地址还原。
MD5摘要有几个明显的问题:
1、短地址的长度受限,比如MD5后的数据长度是32位,需要进行分段循环处理,使短地址足够短
2、MD5的哈希碰撞问题,有一定的概率重复,解决此问题,需要不断的提升算法的复杂度,有些得不偿失
当然不止MD5实现算法比较多,大家可以自行谷歌。
四、代码实现
1:短连接工具类
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.Base64;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 短网址的实现,不管多长,都生成四位链接
*
* @author CHX
*/
public class ShortURL {
private static String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n",
"o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5", "6", "7", "8",
"9", "A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T",
"U", "V", "W", "X", "Y", "Z"};
/**
* 首先从URL中获取固定格式后的内容 *
* @param longUrl 原url
* @param yuMing 域名
*/
public static String myTestShort(String longUrl, String yuMing) {
String newurl = "";
String regex = "(http://|https://)" + yuMing + "(.*)";
Pattern r = Pattern.compile(regex);
// 现在创建 matcher 对象
Matcher m = r.matcher(longUrl);
if (m.find()) {
String url = m.group(2);
if (url != null) {
// 此处就是生成的四位短连接
newurl = changes(url);
//System.out.println(m.group(1) + yuMing + "/" + changes(url));
}
}
return newurl;
}
/**
* 编码思路:考虑到base64编码后,url中只有[0-9][a-z][A-Z]这几种字符,所有字符共有26+26+10=62种 对应的映射表为62进制即可
*
* @param value
* @return
*/
public static String changes(String value) {
// 获取base64编码
String stringBase64 = stringBase64(value);
// 去除最后的==(这是base64的特征,最后以==结尾)
stringBase64 = stringBase64.substring(0, stringBase64.length() - 2);
MessageDigest md5 = null;
try {
md5 = MessageDigest.getInstance("MD5");
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
}
// 利用md5生成32位固长字符串
String mid = new String(bytesToHexString(md5.digest(stringBase64.getBytes())));
StringBuilder outChars = new StringBuilder();
for (int i = 0; i < 4; i++) {
//每八个一组
String sTempSubString = mid.substring(i * 8, i * 8 + 8);
// 想办法将此16进制的八个字符数缩减到62以内,所以取余,然后置换为对应的字母数字
outChars.append(chars[(int) (Long.parseLong(sTempSubString, 16) % chars.length)]);
}
return outChars.toString();
}
/**
* 将字符串转换为base64编码 *
* @param text 原文
* @return
*/
public static String stringBase64(String text) {
return Base64.getEncoder().encodeToString(text.getBytes());
}
/**
* 将byte转换为16进制的字符串 *
* @param src
* @return
*/
public static String bytesToHexString(byte[] src) {
StringBuilder stringBuilder = new StringBuilder();
if (src == null || src.length <= 0) {
return null;
}
for (int i = 0; i < src.length; i++) {
int v = src[i] & 0xFF;
String hv = Integer.toHexString(v);
if (hv.length() < 2) {
stringBuilder.append(0);
}
stringBuilder.append(hv);
}
return stringBuilder.toString();
}
}
2:redis配置
java依赖
<!--springboot中的redis依赖-->
<dependency>
<groupId>org.springframework.b