短 URL 生成器设计：百亿短 URL 无冲突方案

CopyLower

于 2024-08-04 16:50:30 发布

阅读量302

点赞数 11

分类专栏：架构 Java 学习文章标签：分布式系统架构架构 java

本文链接：https://blog.csdn.net/lssffy/article/details/140908102

版权

学习同时被 3 个专栏收录

146 篇文章 6 订阅

订阅专栏

Java

66 篇文章 2 订阅

订阅专栏

架构

16 篇文章 0 订阅

订阅专栏

短 URL 生成器设计：百亿短 URL 无冲突方案

短 URL 服务在现代互联网中具有广泛的应用，例如社交媒体、广告营销和数据分析等场景。设计一个能够生成百亿级别短 URL 且无冲突的系统需要综合考虑系统架构、唯一 ID 生成算法、编码策略、数据库设计、缓存策略、负载均衡、安全性和高可用性等方面。本文将详细介绍如何设计并实现一个高效、可靠的短 URL 生成系统。

需求分析
系统架构设计
- 分布式架构
- 微服务架构
唯一 ID 生成算法
- 雪花算法（Snowflake）
- 全局唯一 ID（UUID）
短 URL 编码策略
- Base62 编码
- 自定义字符集编码
数据库设计
- 数据库表设计
- 分库分表
- 读写分离
缓存策略
- 本地缓存
- 分布式缓存
负载均衡与高可用性
- 负载均衡算法
- 高可用架构设计
接口设计与实现
- 短 URL 生成接口
- 短 URL 解析接口
性能优化与监控
- 性能优化策略
- 系统监控与报警
安全性与防护措施
- 限流与降级
- 防止作弊与攻击
实际应用案例
总结

1. 需求分析

短 URL 服务的主要需求包括：

短 URL 生成：将长 URL 生成短 URL。
短 URL 解析：根据短 URL 还原出原始长 URL。
高并发支持：系统需要支持百亿级别的短 URL 生成和解析。
无冲突保证：生成的短 URL 必须唯一且无冲突。

2. 系统架构设计

高并发系统的架构设计需要考虑多个层次，包括分布式架构和微服务架构。

2.1 分布式架构

分布式架构通过将系统功能分布到多个节点上，提高系统的并发处理能力和可用性。

水平扩展：通过增加节点的方式扩展系统处理能力。
数据分片：将数据分片存储在多个节点上，均衡负载。

2.2 微服务架构

微服务架构将系统功能拆分为独立的服务，每个服务可以独立开发、部署和扩展。

独立部署：各个服务独立部署，提高系统灵活性。
服务发现：通过服务注册和发现机制，动态管理服务实例。

# Spring Cloud Eureka Server configuration
server:
  port: 8761

eureka:
  client:
    registerWithEureka: false
    fetchRegistry: false

3. 唯一 ID 生成算法

唯一 ID 生成是保证短 URL 无冲突的关键。常见的唯一 ID 生成算法包括雪花算法（Snowflake）和全局唯一 ID（UUID）。

3.1 雪花算法（Snowflake）

雪花算法是一种 Twitter 提出的分布式唯一 ID 生成算法，通过时间戳、数据中心 ID、机器 ID 和序列号生成唯一 ID。

public class SnowflakeIdGenerator {
    private final long workerId;
    private final long datacenterId;
    private final long sequence;

    private static final long twepoch = 1288834974657L;
    private static final long workerIdBits = 5L;
    private static final long datacenterIdBits = 5L;
    private static final long maxWorkerId = -1L ^ (-1L << workerIdBits);
    private static final long maxDatacenterId = -1L ^ (-1L << datacenterIdBits);
    private static final long sequenceBits = 12L;
    private static final long workerIdShift = sequenceBits;
    private static final long datacenterIdShift = sequenceBits + workerIdBits;
    private static final long timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits;
    private static final long sequenceMask = -1L ^ (-1L << sequenceBits);

    private long lastTimestamp = -1L;

    public SnowflakeIdGenerator(long workerId, long datacenterId, long sequence) {
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
        }
        if (datacenterId > maxDatacenterId || datacenterId < 0) {
            throw new IllegalArgumentException(String.format("datacenter Id can't be greater than %d or less than 0", maxDatacenterId));
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
        this.sequence = sequence;
    }

    public synchronized long nextId() {
        long timestamp = timeGen();

        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards. Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - twepoch) << timestampLeftShift) |
               (datacenterId << datacenterIdShift) |
               (workerId << workerIdShift) |
               sequence;
    }

    private long tilNextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = timeGen();
        }
        return timestamp;
    }

    private long timeGen() {
        return System.currentTimeMillis();
    }
}

3.2 全局唯一 ID（UUID）

UUID 是一种标准的全局唯一标识符，通常用于分布式系统中唯一标识对象。

import java.util.UUID;

public class UUIDGenerator {
    public static String generateUUID() {
        return UUID.randomUUID().toString();
    }
}

4. 短 URL 编码策略

短 URL 编码策略是将唯一 ID 转换为短 URL 的关键步骤。常见的编码策略包括 Base62 编码和自定义字符集编码。

4.1 Base62 编码

Base62 编码使用 62 个字符（0-9, a-z, A-Z）进行编码，可以生成较短的 URL。

public class Base62Encoder {
    private static final char[] CHARACTERS = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz".toCharArray();

    public static String encode(long value) {
        StringBuilder sb = new StringBuilder();
        while (value > 0) {
            sb.append(CHARACTERS[(int) (value % 62)]);
            value /= 62;
        }
        return sb.reverse().toString();
    }
}

4.2 自定义字符集编码

自定义字符集编码可以根据需求定义字符集，生成特定长度的短 URL。

public class CustomEncoder {
    private static final char[] CHARACTERS = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz".toCharArray();

    public static String encode(long value, int base) {
        StringBuilder sb = new StringBuilder();
        while (value > 0) {
            sb.append(CHARACTERS[(int) (value % base)]);
            value /= base;
        }
        return sb.reverse().toString();
    }
}

5. 数据库设计

数据库设计需要考虑如何在高并发环境下保持高效和可靠。主要策略包括分库分表和读写分离。

5.1 数据库表设计

数据库表设计需要满足短 URL 系统的基本功能，包括短 URL 和长 URL 的映射关系存储。

-- 短 URL 映射表
CREATE TABLE short_urls (
    id BIGINT PRIMARY KEY AUTO_INCREMENT,
    short_url VARCHAR(10) NOT NULL UNIQUE,
    long_url TEXT NOT NULL,
    create_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    update_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP
);

5.2 分库分表

分库分表通过将数据分散到多个数据库和表中，减轻单个数据库的压力。

CREATE TABLE short_urls_0 LIKE short_urls;
CREATE TABLE short_urls_1 LIKE short_urls;

INSERT INTO short_urls_0 SELECT * FROM short_urls WHERE

 id % 2 = 0;
INSERT INTO short_urls_1 SELECT * FROM short_urls WHERE id % 2 = 1;

5.3 读写分离

读写分离通过将读操作和写操作分离，提升数据库的读写性能。

import org.springframework.jdbc.datasource.lookup.AbstractRoutingDataSource;

public class ReadWriteRoutingDataSource extends AbstractRoutingDataSource {
    @Override
    protected Object determineCurrentLookupKey() {
        return TransactionSynchronizationManager.isCurrentTransactionReadOnly() ? "read" : "write";
    }
}

6. 缓存策略

缓存策略通过缓存热点数据，减少数据库访问，提高系统性能。

6.1 本地缓存

本地缓存将热点数据缓存到应用服务器内存中，减少数据库访问。

import com.google.common.cache.Cache;
import com.google.common.cache.CacheBuilder;

Cache<String, String> localCache = CacheBuilder.newBuilder()
    .maximumSize(10000)
    .expireAfterWrite(10, TimeUnit.MINUTES)
    .build();

6.2 分布式缓存

分布式缓存将数据缓存到多个节点上，提高缓存的扩展性和可靠性。

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;

JedisPool pool = new JedisPool("localhost", 6379);
try (Jedis jedis = pool.getResource()) {
    jedis.set("short_url:12345", "https://example.com/long-url");
    String longUrl = jedis.get("short_url:12345");
}

7. 负载均衡与高可用性

负载均衡与高可用性通过均衡请求流量和故障转移，确保系统的稳定运行。

7.1 负载均衡算法

常见的负载均衡算法包括轮询、加权轮询、最小连接数、IP哈希等。

http {
    upstream short-url-service {
        server short-url1.example.com;
        server short-url2.example.com;
    }

    server {
        location / {
            proxy_pass http://short-url-service;
        }
    }
}

7.2 高可用架构设计

高可用架构通过冗余和故障转移机制，保证系统在节点故障时仍能正常运行。

主从架构：主节点负责写操作，从节点负责读操作，主节点故障时从节点自动提升为主节点。
集群架构：多个节点组成集群，节点间数据同步和负载均衡。

8. 接口设计与实现

接口设计与实现是短 URL 系统的核心，主要包括短 URL 生成接口和短 URL 解析接口。

8.1 短 URL 生成接口

短 URL 生成接口用于处理短 URL 生成请求。

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/api/short-urls")
public class ShortUrlController {
    @Autowired
    private ShortUrlService shortUrlService;

    @PostMapping("/generate")
    public ResponseEntity<String> generateShortUrl(@RequestBody String longUrl) {
        String shortUrl = shortUrlService.generateShortUrl(longUrl);
        return ResponseEntity.ok(shortUrl);
    }
}

@Service
public class ShortUrlService {
    @Autowired
    private ShortUrlRepository shortUrlRepository;
    @Autowired
    private JedisPool jedisPool;

    public String generateShortUrl(String longUrl) {
        long id = new SnowflakeIdGenerator(1, 1, 0).nextId();
        String shortUrl = Base62Encoder.encode(id);
        shortUrlRepository.save(new ShortUrl(shortUrl, longUrl));
        try (Jedis jedis = jedisPool.getResource()) {
            jedis.set("short_url:" + shortUrl, longUrl);
        }
        return shortUrl;
    }
}

@Entity
public class ShortUrl {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private String shortUrl;
    private String longUrl;

    public ShortUrl(String shortUrl, String longUrl) {
        this.shortUrl = shortUrl;
        this.longUrl = longUrl;
    }

    // Getters and setters
}

8.2 短 URL 解析接口

短 URL 解析接口用于处理短 URL 解析请求。

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.*;

@RestController
@RequestMapping("/api/short-urls")
public class ShortUrlController {
    @Autowired
    private ShortUrlService shortUrlService;

    @GetMapping("/{shortUrl}")
    public ResponseEntity<String> getLongUrl(@PathVariable String shortUrl) {
        String longUrl = shortUrlService.getLongUrl(shortUrl);
        if (longUrl != null) {
            return ResponseEntity.ok(longUrl);
        } else {
            return ResponseEntity.status(HttpStatus.NOT_FOUND).build();
        }
    }
}

@Service
public class ShortUrlService {
    @Autowired
    private ShortUrlRepository shortUrlRepository;
    @Autowired
    private JedisPool jedisPool;

    public String getLongUrl(String shortUrl) {
        try (Jedis jedis = jedisPool.getResource()) {
            String longUrl = jedis.get("short_url:" + shortUrl);
            if (longUrl != null) {
                return longUrl;
            }
        }
        ShortUrl shortUrlEntity = shortUrlRepository.findByShortUrl(shortUrl);
        if (shortUrlEntity != null) {
            try (Jedis jedis = jedisPool.getResource()) {
                jedis.set("short_url:" + shortUrl, shortUrlEntity.getLongUrl());
            }
            return shortUrlEntity.getLongUrl();
        }
        return null;
    }
}

public interface ShortUrlRepository extends JpaRepository<ShortUrl, Long> {
    ShortUrl findByShortUrl(String shortUrl);
}

9. 性能优化与监控

性能优化与监控是保证系统稳定运行的重要手段。

9.1 性能优化策略

通过索引优化、批量处理和缓存策略，提高系统性能。

CREATE INDEX idx_short_url ON short_urls(short_url);

9.2 系统监控与报警

通过实时监控和报警机制，及时发现和处理问题。

global:
  scrape_interval: 15s
scrape_configs:
  - job_name: 'short-url-service'
    static_configs:
      - targets: ['localhost:9090']

10. 安全性与防护措施

安全性与防护措施通过限流、降级和防止作弊与攻击，保证系统的安全性和稳定性。

10.1 限流与降级

限流通过限制请求频率，防止系统过载；降级通过关闭部分功能，保证核心功能的可用性。

import com.google.common.util.concurrent.RateLimiter;

RateLimiter rateLimiter = RateLimiter.create(1000);
if (rateLimiter.tryAcquire()) {
    // 处理请求
} else {
    // 返回错误或降级处理
}

10.2 防止作弊与攻击

防止作弊与攻击通过身份验证、数据校验和行为监控，保护系统免受恶意行为。

public class SecurityService {
    private ConcurrentHashMap<String, Integer> userRequestCounts = new ConcurrentHashMap<>();

    public boolean isRequestAllowed(String userId) {
        int count = userRequestCounts.getOrDefault(userId, 0);
        if (count > 100) {
            return false;
        } else {
            userRequestCounts.put(userId, count + 1);
            return true;
        }
    }

    public boolean validateRequest(String userId, String shortUrl) {
        // 验证用户身份和请求参数的合法性
        return true;
    }
}

11. 实际应用案例

以下是一个实际应用案例，展示如何实现一个百亿短 URL 无冲突的短 URL 生成系统。

11.1 系统架构

系统采用分布式架构和微服务架构，包括短 URL 生成服务、短 URL 解析服务和缓存服务。

11.2 缓存策略

系统使用Redis缓存短 URL 和长 URL 的映射，提高查询性能。

import redis.clients.jedis.Jedis;
import redis.clients.jedis.JedisPool;

JedisPool pool = new JedisPool("localhost", 6379);
try (Jedis jedis = pool.getResource()) {
    jedis.set("short_url:abc123", "https://example.com/long-url");
    String longUrl = jedis.get("short_url:abc123");
}

11.3 数据库优化

系统采用分库分表和读写分离策略，提高数据库性能。

-- 分库分表
CREATE TABLE short_urls_0 LIKE short_urls;
CREATE TABLE short_urls_1 LIKE short_urls;

-- 读写分离
-- 主库处理写操作
-- 从库处理读操作

11.4 负载均衡

系统使用Nginx实现请求的负载均衡，确保系统高可用性。

http {
    upstream short-url-service {
        server short-url1.example.com;
        server short-url2.example.com;
    }

    server

 {
        location / {
            proxy_pass http://short-url-service;
        }
    }
}

12. 总结

通过本文的详细介绍，您应对如何设计一个百亿短 URL 无冲突的短 URL 生成系统有了全面的了解。我们讨论了需求分析、系统架构设计、唯一 ID 生成算法、短 URL 编码策略、数据库设计、缓存策略、负载均衡与高可用性、接口设计与实现、性能优化与监控、安全性与防护措施等方面。通过合理利用这些技术手段，可以构建一个高效、稳定和可靠的短 URL 系统，满足百亿级别短 URL 生成和解析的需求。

CopyLower

关注

11
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
短 URL 生成器设计：百亿短 URL 无冲突方案

自定义字符集编码可以根据需求定义字符集，生成特定长度的短 URL。通过本文的详细介绍，您应对如何设计一个百亿短 URL 无冲突的短 URL 生成系统有了全面的了解。我们讨论了需求分析、系统架构设计、唯一 ID 生成算法、短 URL 编码策略、数据库设计、缓存策略、负载均衡与高可用性、接口设计与实现、性能优化与监控、安全性与防护措施等方面。通过合理利用这些技术手段，可以构建一个高效、稳定和可靠的短 URL 系统，满足百亿级别短 URL 生成和解析的需求。
复制链接

扫一扫