短 URL 生成器设计:百亿短 URL 无冲突方案

66 篇文章 2 订阅
16 篇文章 0 订阅

短 URL 生成器设计:百亿短 URL 无冲突方案

短 URL 服务在现代互联网中具有广泛的应用,例如社交媒体、广告营销和数据分析等场景。设计一个能够生成百亿级别短 URL 且无冲突的系统需要综合考虑系统架构、唯一 ID 生成算法、编码策略、数据库设计、缓存策略、负载均衡、安全性和高可用性等方面。本文将详细介绍如何设计并实现一个高效、可靠的短 URL 生成系统。

目录

  1. 需求分析
  2. 系统架构设计
    • 分布式架构
    • 微服务架构
  3. 唯一 ID 生成算法
    • 雪花算法(Snowflake)
    • 全局唯一 ID(UUID)
  4. 短 URL 编码策略
    • Base62 编码
    • 自定义字符集编码
  5. 数据库设计
    • 数据库表设计
    • 分库分表
    • 读写分离
  6. 缓存策略
    • 本地缓存
    • 分布式缓存
  7. 负载均衡与高可用性
    • 负载均衡算法
    • 高可用架构设计
  8. 接口设计与实现
    • 短 URL 生成接口
    • 短 URL 解析接口
  9. 性能优化与监控
    • 性能优化策略
    • 系统监控与报警
  10. 安全性与防护措施
    • 限流与降级
    • 防止作弊与攻击
  11. 实际应用案例
  12. 总结

1. 需求分析

短 URL 服务的主要需求包括:

  • 短 URL 生成:将长 URL 生成短 URL。
  • 短 URL 解析:根据短 URL 还原出原始长 URL。
  • 高并发支持:系统需要支持百亿级别的短 URL 生成和解析。
  • 无冲突保证:生成的短 URL 必须唯一且无冲突。

2. 系统架构设计

高并发系统的架构设计需要考虑多个层次,包括分布式架构和微服务架构。

2.1 分布式架构

分布式架构通过将系统功能分布到多个节点上,提高系统的并发处理能力和可用性。

  • 水平扩展:通过增加节点的方式扩展系统处理能力。
  • 数据分片:将数据分片存储在多个节点上,均衡负载。
2.2 微服务架构

微服务架构将系统功能拆分为独立的服务,每个服务可以独立开发、部署和扩展。

  • 独立部署:各个服务独立部署,提高系统灵活性。
  • 服务发现:通过服务注册和发现机制,动态管理服务实例。
# Spring Cloud Eureka Server configuration
server:
  port: 8761

eureka:
  client:
    registerWithEureka: false
    fetchRegistry: false

3. 唯一 ID 生成算法

唯一 ID 生成是保证短 URL 无冲突的关键。常见的唯一 ID 生成算法包括雪花算法(Snowflake)和全局唯一 ID(UUID)。

3.1 雪花算法(Snowflake)

雪花算法是一种 Twitter 提出的分布式唯一 ID 生成算法,通过时间戳、数据中心 ID、机器 ID 和序列号生成唯一 ID。

public class SnowflakeIdGenerator {
    private final long workerId;
    private final long datacenterId;
    private final long sequence;

    private static final long twepoch = 1288834974657L;
    private static final long workerIdBits = 5L;
    private static final long datacenterIdBits = 5L;
    private static final long maxWorkerId = -1L ^ (-1L << workerIdBits);
    private static final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
    private static final long sequenceBits = 12L;
    private static final long workerIdShift = sequenceBits;
    private static final long datacenterIdShift = sequenceBits + workerIdBits;
    private static final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
    private static final long sequenceMask = -1L ^ (-1L << sequenceBits);

    private long lastTimestamp = -1L;

    public SnowflakeIdGenerator(long workerId, long datacenterId, long sequence) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
        }
        if (datacenterId > maxDatacenterId || datacenterId < 0) {
            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
        this.sequence = sequence;
    }

    public synchronized long nextId() {
        long timestamp = timeGen();

        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - twepoch) << timestampLeftShift) |
               (datacenterId << datacenterIdShift) |
               (workerId << workerIdShift) |
               sequence;
    }

    private long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    private long timeGen() {
        return System.currentTimeMillis();
    }
}
3.2 全局唯一 ID(UUID)

UUID 是一种标准的全局唯一标识符,通常用于分布式系统中唯一标识对象。

import java.util.UUID;

public class UUIDGenerator {
    public static String generateUUID() {
        return UUID.randomUUID().toString();
    }
}

4. 短 URL 编码策略

短 URL 编码策略是将唯一 ID 转换为短 URL 的关键步骤。常见的编码策略包括 Base62 编码和自定义字符集编码。

4.1 Base62 编码

Base62 编码使用 62 个字符(0-9, a-z, A-Z)进行编码,可以生成较短的 URL。

public class Base62Encoder {
    private static final char[] CHARACTERS = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz".toCharArray();

    public static String encode(long value) {
        StringBuilder sb = new StringBuilder();
        while (value > 0) {
            sb.append(CHARACTERS[(int) (value % 62)]);
            value /= 62;
        }
        return sb.reverse().toString();
    }
}
4.2 自定义字符集编码

自定义字符集编码可以根据需求定义字符集,生成特定长度的短 URL。

public class CustomEncoder {
    private static final char[] CHARACTERS = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz".toCharArray();

    public static String encode(long value, int base) {
        StringBuilder sb = new StringBuilder();
        while (value > 0) {
            sb.append(CHARACTERS[(int) (value % base)]);
            value /= base;
        }
        return sb.reverse().toString();
    }
}

5. 数据库设计

数据库设计需要考虑如何在高并发环境下保持高效和可靠。主要策略包括分库分表和读写分离。

5.1 数据库表设计

数据库表设计需要满足短 URL 系统的基本功能,包括短 URL 和长 URL 的映射关系存储。

-- 短 URL 映射表
CREATE TABLE short_urls (
    id BIGINT PRIMARY KEY AUTO_INCREMENT,
    short_url VARCHAR(10) NOT NULL UNIQUE,
    long_url TEXT NOT NULL,
    create_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    update_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);
5.2 分库分表

分库分表通过将数据分散到多个数据库和表中,减轻单个数据库的压力。

CREATE TABLE short_urls_0 LIKE short_urls;
CREATE TABLE short_urls_1 LIKE short_urls;

INSERT INTO short_urls_0 SELECT * FROM short_urls WHERE

 id % 2 = 0;
INSERT INTO short_urls_1 SELECT * FROM short_urls WHERE id % 2 = 1;
5.3 读写分离

读写分离通过将读操作和写操作分离,提升数据库的读写性能。

import org.springframework.jdbc.datasource.lookup.AbstractRoutingDataSource;

public class ReadWriteRoutingDataSource extends AbstractRoutingDataSource {
    @Override
    protected Object determineCurrentLookupKey() {
        return TransactionSynchronizationManager.isCurrentTransactionReadOnly() ? "read" : "write";
    }
}

6. 缓存策略

缓存策略通过缓存热点数据,减少数据库访问,提高系统性能。

6.1 本地缓存

本地缓存将热点数据缓存到应用服务器内存中,减少数据库访问。

import com.google.common.cache.Cache;
import com.google.common.cache.CacheBuilder;

Cache<String, String> localCache = CacheBuilder.newBuilder()
    .maximumSize(10000)
    .expireAfterWrite(10, TimeUnit.MINUTES)
    .build();
6.2 分布式缓存

分布式缓存将数据缓存到多个节点上,提高缓存的扩展性和可靠性。

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;

JedisPool pool = new JedisPool("localhost", 6379);
try (Jedis jedis = pool.getResource()) {
    jedis.set("short_url:12345", "https://example.com/long-url");
    String longUrl = jedis.get("short_url:12345");
}

7. 负载均衡与高可用性

负载均衡与高可用性通过均衡请求流量和故障转移,确保系统的稳定运行。

7.1 负载均衡算法

常见的负载均衡算法包括轮询、加权轮询、最小连接数、IP哈希等。

http {
    upstream short-url-service {
        server short-url1.example.com;
        server short-url2.example.com;
    }

    server {
        location / {
            proxy_pass http://short-url-service;
        }
    }
}
7.2 高可用架构设计

高可用架构通过冗余和故障转移机制,保证系统在节点故障时仍能正常运行。

  • 主从架构:主节点负责写操作,从节点负责读操作,主节点故障时从节点自动提升为主节点。
  • 集群架构:多个节点组成集群,节点间数据同步和负载均衡。

8. 接口设计与实现

接口设计与实现是短 URL 系统的核心,主要包括短 URL 生成接口和短 URL 解析接口。

8.1 短 URL 生成接口

短 URL 生成接口用于处理短 URL 生成请求。

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/api/short-urls")
public class ShortUrlController {
    @Autowired
    private ShortUrlService shortUrlService;

    @PostMapping("/generate")
    public ResponseEntity<String> generateShortUrl(@RequestBody String longUrl) {
        String shortUrl = shortUrlService.generateShortUrl(longUrl);
        return ResponseEntity.ok(shortUrl);
    }
}

@Service
public class ShortUrlService {
    @Autowired
    private ShortUrlRepository shortUrlRepository;
    @Autowired
    private JedisPool jedisPool;

    public String generateShortUrl(String longUrl) {
        long id = new SnowflakeIdGenerator(1, 1, 0).nextId();
        String shortUrl = Base62Encoder.encode(id);
        shortUrlRepository.save(new ShortUrl(shortUrl, longUrl));
        try (Jedis jedis = jedisPool.getResource()) {
            jedis.set("short_url:" + shortUrl, longUrl);
        }
        return shortUrl;
    }
}

@Entity
public class ShortUrl {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private String shortUrl;
    private String longUrl;

    public ShortUrl(String shortUrl, String longUrl) {
        this.shortUrl = shortUrl;
        this.longUrl = longUrl;
    }

    // Getters and setters
}
8.2 短 URL 解析接口

短 URL 解析接口用于处理短 URL 解析请求。

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/api/short-urls")
public class ShortUrlController {
    @Autowired
    private ShortUrlService shortUrlService;

    @GetMapping("/{shortUrl}")
    public ResponseEntity<String> getLongUrl(@PathVariable String shortUrl) {
        String longUrl = shortUrlService.getLongUrl(shortUrl);
        if (longUrl != null) {
            return ResponseEntity.ok(longUrl);
        } else {
            return ResponseEntity.status(HttpStatus.NOT_FOUND).build();
        }
    }
}

@Service
public class ShortUrlService {
    @Autowired
    private ShortUrlRepository shortUrlRepository;
    @Autowired
    private JedisPool jedisPool;

    public String getLongUrl(String shortUrl) {
        try (Jedis jedis = jedisPool.getResource()) {
            String longUrl = jedis.get("short_url:" + shortUrl);
            if (longUrl != null) {
                return longUrl;
            }
        }
        ShortUrl shortUrlEntity = shortUrlRepository.findByShortUrl(shortUrl);
        if (shortUrlEntity != null) {
            try (Jedis jedis = jedisPool.getResource()) {
                jedis.set("short_url:" + shortUrl, shortUrlEntity.getLongUrl());
            }
            return shortUrlEntity.getLongUrl();
        }
        return null;
    }
}

public interface ShortUrlRepository extends JpaRepository<ShortUrl, Long> {
    ShortUrl findByShortUrl(String shortUrl);
}

9. 性能优化与监控

性能优化与监控是保证系统稳定运行的重要手段。

9.1 性能优化策略

通过索引优化、批量处理和缓存策略,提高系统性能。

CREATE INDEX idx_short_url ON short_urls(short_url);
9.2 系统监控与报警

通过实时监控和报警机制,及时发现和处理问题。

global:
  scrape_interval: 15s
scrape_configs:
  - job_name: 'short-url-service'
    static_configs:
      - targets: ['localhost:9090']

10. 安全性与防护措施

安全性与防护措施通过限流、降级和防止作弊与攻击,保证系统的安全性和稳定性。

10.1 限流与降级

限流通过限制请求频率,防止系统过载;降级通过关闭部分功能,保证核心功能的可用性。

import com.google.common.util.concurrent.RateLimiter;

RateLimiter rateLimiter = RateLimiter.create(1000);
if (rateLimiter.tryAcquire()) {
    // 处理请求
} else {
    // 返回错误或降级处理
}
10.2 防止作弊与攻击

防止作弊与攻击通过身份验证、数据校验和行为监控,保护系统免受恶意行为。

public class SecurityService {
    private ConcurrentHashMap<String, Integer> userRequestCounts = new ConcurrentHashMap<>();

    public boolean isRequestAllowed(String userId) {
        int count = userRequestCounts.getOrDefault(userId, 0);
        if (count > 100) {
            return false;
        } else {
            userRequestCounts.put(userId, count + 1);
            return true;
        }
    }

    public boolean validateRequest(String userId, String shortUrl) {
        // 验证用户身份和请求参数的合法性
        return true;
    }
}

11. 实际应用案例

以下是一个实际应用案例,展示如何实现一个百亿短 URL 无冲突的短 URL 生成系统。

11.1 系统架构

系统采用分布式架构和微服务架构,包括短 URL 生成服务、短 URL 解析服务和缓存服务。

11.2 缓存策略

系统使用Redis缓存短 URL 和长 URL 的映射,提高查询性能。

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;

JedisPool pool = new JedisPool("localhost", 6379);
try (Jedis jedis = pool.getResource()) {
    jedis.set("short_url:abc123", "https://example.com/long-url");
    String longUrl = jedis.get("short_url:abc123");
}
11.3 数据库优化

系统采用分库分表和读写分离策略,提高数据库性能。

-- 分库分表
CREATE TABLE short_urls_0 LIKE short_urls;
CREATE TABLE short_urls_1 LIKE short_urls;

-- 读写分离
-- 主库处理写操作
-- 从库处理读操作
11.4 负载均衡

系统使用Nginx实现请求的负载均衡,确保系统高可用性。

http {
    upstream short-url-service {
        server short-url1.example.com;
        server short-url2.example.com;
    }

    server

 {
        location / {
            proxy_pass http://short-url-service;
        }
    }
}

12. 总结

通过本文的详细介绍,您应对如何设计一个百亿短 URL 无冲突的短 URL 生成系统有了全面的了解。我们讨论了需求分析、系统架构设计、唯一 ID 生成算法、短 URL 编码策略、数据库设计、缓存策略、负载均衡与高可用性、接口设计与实现、性能优化与监控、安全性与防护措施等方面。通过合理利用这些技术手段,可以构建一个高效、稳定和可靠的短 URL 系统,满足百亿级别短 URL 生成和解析的需求。

  • 11
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CopyLower

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值