长URL链接转短码JAVA算法[附源码]

概述

项目需要一个将url链接串转短码算法,在网上搜索的算法https://blog.csdn.net/crazy123456789/article/details/25054705有一个明显的缺陷,就是其中

		long index = 0x0000003D & lHexLong;
	    // 把取得的字符相加
	    outChars += chars[( int ) index];
	   // 每次循环按位右移 5 位
	    lHexLong = lHexLong >> 5;

这个index的取值范围额只有32个,永远不可能是 2、3、6、7、10、11… 。所以自己重新写一个算法。

算法说明

算法的步骤如下:

  1. 对Url进行md5编码
  2. 对md5码进行base64编码,长度为22
  3. 剔除base64码中的‘+’和‘/’, 取前面的一段,
  4. 如果位数不够,用base64码加上url再进行一次md5,用这个补齐,
  5. 循环4直到位数满足短码的长度需求
    说明一般短码的长度在6~10之间,一次就可以了。解决冲突的方法也简单,可以取长一点,比如目标是8位,可以取16位,如果发现0~7冲突,就取1~8 以此类推。算法源码如下:
 public static String shortenCodeUrl(String longUrl, int urlLength) {
        if (urlLength < 4 ) {
            urlLength = 8;// defalut length
        }
        StringBuilder sbBuilder = new StringBuilder(urlLength + 2);
        String md5Hex = "";
        int nLen = 0;
        while (nLen < urlLength) {
        	// 这个方法是先 md5 再 base64编码 参见
        	// https://github.com/ndxt/centit-commons/blob/master/centit-utils/src/main/java/com/centit/support/security/Md5Encoder.java
            md5Hex = Md5Encoder.encodeBase64(md5Hex + longUrl);
            for(int i=0;i<md5Hex.length();i++){
                char c = md5Hex.charAt(i);
                if(c != '/' && c != '+'){
                    sbBuilder.append(c);
                    nLen ++;
                }
                if(nLen == urlLength){
                    break;
                }
            }
        }
        return sbBuilder.toString();
    }

进一步探讨

网上还有很多算法,比如:自增长算法(这个可能存在增长锁的问题),随机数算法。按理来说都是可行的,但是这些算法无法去重,就是可能会出现一个url在对应表中有多条记录。用上面基于Md5的算法,可以解决这个问题。在发现编码存在时进一步核实原始url是否一致,如果一致就不是冲突。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值