互联网大厂Java面试实录：电商高并发场景下的Java性能优化与问题排查

草根程序猿。

已于 2025-04-28 17:36:47 修改

阅读量867

点赞数 20

分类专栏： Java场景面试宝典文章标签： java 面试性能优化

于 2025-04-28 17:04:00 首次发布

本文链接：https://blog.csdn.net/weixin_37518202/article/details/147591378

版权

Java场景面试宝典专栏收录该内容

2 篇文章

订阅专栏

面试实录：某电商平台高级Java工程师职位

面试官：张先生，下午好。我看您简历上写的是有五年Java开发经验，主要负责过电商平台的订单系统，是吗？

张麻子：对对对！我可是从电商系统的0到1都参与过，日订单量从几百到几十万的增长过程我都见证了，系统优化也做了不少！

面试官：那很好，今天我们就从您的项目经验聊起。首先想了解一下，在订单系统开发过程中，您遇到过什么典型的性能问题？

张麻子：哦，这个嘛，最典型的就是订单系统的数据库查询慢了呗。特别是大促的时候，数据库直接就扛不住了，CPU满载，查询响应时间从毫秒级变成了秒级，用户下单页面直接超时。

面试官：嗯，这确实是常见问题。那您具体是如何定位并解决这个问题的呢？

张麻子：我第一时间排查了慢查询日志，发现主要是订单表的查询太慢。然后我给订单表的几个常用字段加了索引，再用Redis做了热点数据缓存，问题就解决了！性能提升了至少10倍！

面试官：索引和缓存确实是基本优化手段。那么在使用Redis缓存时，您是否遇到过缓存穿透或缓存雪崩的问题？如何处理的？

张麻子：呃…缓存穿透…那个…就是查不到缓存直接打到数据库嘛。我们处理方式很简单，就是…那个…布隆过滤器！对，我们用了布隆过滤器来解决，效果挺好的。

第二轮：深入技术细节

面试官：在您提到的大促场景中，除了数据库层面，订单系统的JVM层面是否也出现过问题？比如GC问题导致的服务响应时间延长？

张麻子：有过有过！记得有次大促，系统突然变得特别卡，日志里全是GC相关的警告。我检查了监控，发现Full GC频繁发生，每次都要停顿好几秒。

面试官：您是如何分析和解决这个GC问题的呢？用了哪些工具？做了哪些调优？

张麻子：我们用了…JVisualVM查看了堆内存情况，发现Eden区很快就满了。然后我们调整了JVM参数，把新生代的空间调大了一些，同时把GC算法改成了…G1，对，用G1替换了原来的并行GC。结果系统的停顿时间明显减少了。

面试官：不错。在分布式系统中，您的订单服务是如何与其他微服务交互的？有没有遇到过服务间调用导致的性能瓶颈？

张麻子：我们用的是Spring Cloud，服务之间通过Feign调用。有段时间确实发现调用库存服务特别慢，排查后发现是…那个…线程池配置不合理！默认的线程池太小了，我们把它改大了点，问题就解决了。（擦汗）

面试官：您刚才提到线程池配置问题，能详细说一下您是如何确定合适的线程池参数的吗？

张麻子：这个嘛…就是…我们做了压测，然后…根据Little’s Law计算的…具体公式我有点忘了，但基本思路是根据CPU核心数和任务执行时间来计算。最后我们设置了核心线程数为CPU核心数的两倍，这样就比较合理。

第三轮：深入业务场景

面试官：在电商系统中，秒杀是一个很有挑战性的场景。您参与过秒杀系统的设计吗？如何保证系统的高并发和数据一致性？

张麻子：参与过！秒杀主要是流量太集中，我们采用了…那个…限流措施！对，用Redis计数器实现了限流。然后为了保证数据一致性，我们用了…分布式锁！对，Redis的分布式锁防止超卖。

面试官：有意思。那么秒杀系统的整体架构是怎样的？如何处理前端、中间层和后端的压力？

张麻子：前端我们用了静态页面和CDN加速，中间层…嗯…用了消息队列削峰，后端就是Redis加分布式锁保证一致性。具体架构图我没带，不好意思…（不好意思地笑）

面试官：在消息队列使用过程中，您是否遇到过消息丢失或重复消费的问题？如何解决的？

张麻子：这个…好像有遇到过…消息丢失我们通过…那个…RabbitMQ的确认机制解决的。重复消费就是做幂等处理嘛，就是不管来多少次同样的请求，结果都一样。具体实现…呃…是在Redis里记录处理过的消息ID。

面试官：好的，今天的面试就到这里。您在基础技术方面有一定的了解，但在深入技术细节和架构设计方面还需要加强。我们会在一周内给您答复，感谢您参加面试。

张麻子：谢谢面试官，我很期待能加入贵公司！我一定会继续学习的！

面试问题详解与最佳实践

1. 数据库性能优化

问题：订单系统数据库查询慢，特别是高峰期。

正确解答：

问题定位：使用慢查询日志找出具体慢SQL；使用EXPLAIN分析执行计划；使用监控工具观察数据库CPU、内存、IO等指标。
解决方案：
1. 索引优化：为热点查询字段创建合适索引，避免全表扫描；优化联合索引顺序遵循最左匹配原则
2. SQL优化：避免SELECT *；避免在索引字段上使用函数；合理使用JOIN替代子查询
3. 分库分表：对订单表按时间或用户ID进行水平分表；历史订单和活跃订单分离
4. 读写分离：主库负责写操作，从库负责读操作，减轻主库压力
5. 缓存应用：使用多级缓存策略，包括本地缓存(Caffeine)和分布式缓存(Redis)

2. 缓存穿透与雪崩处理

问题：Redis缓存使用中的缓存穿透、雪崩问题。

正确解答：

缓存穿透：指查询一个不存在的数据，导致请求直接落到数据库
- 解决方案：
  1. 布隆过滤器：在缓存之前加入布隆过滤器，快速判断key是否存在
  2. 缓存空值：对不存在的数据也进行缓存，但设置较短的过期时间
  3. 请求参数校验：对参数进行合法性校验，拦截不合理请求
缓存雪崩：指大量缓存同时过期或Redis宕机，导致请求全部落到数据库
- 解决方案：
  1. 过期时间随机化：给缓存的过期时间增加随机值，避免同时过期
  2. 热点数据永不过期：对核心数据设置永不过期，通过后台更新保持数据新鲜
  3. Redis高可用：使用Redis Cluster或Sentinel确保Redis服务高可用
  4. 限流降级：当缓存失效时启动限流措施，保护数据库

3. JVM调优实践

问题：系统在高负载下出现频繁GC，导致服务响应延迟。

正确解答：

问题定位：
1. 使用jstat -gcutil PID 1000观察GC频率和时间
2. 使用jmap -heap PID分析堆内存分布
3. 使用jstack PID分析线程状态
4. 使用专业工具如JVisualVM、MAT分析内存泄漏
解决方案：
1. 调整内存分配：根据应用特点调整新生代与老年代比例(-XX:NewRatio)
2. 选择合适GC算法：对于大内存服务器，使用G1GC(-XX:+UseG1GC)减少停顿时间
3. 内存泄漏修复：检查并修复可能的内存泄漏点，如缓存未清理、连接未关闭等
4. 参数优化示例：
```
-Xms4g -Xmx4g -XX:MetaspaceSize=256m -XX:MaxMetaspaceSize=256m 
-XX:+UseG1GC -XX:MaxGCPauseMillis=100 -XX:+ParallelRefProcEnabled
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/path/to/gc.log
```

4. 线程池配置最佳实践

问题：如何合理配置线程池参数。

正确解答：

线程池参数计算：
1. 核心线程数计算：基于Little’s Law - L = λW
  - CPU密集型任务：核心线程数 = CPU核心数 + 1
  - IO密集型任务：核心线程数 = CPU核心数 * (1 + 平均等待时间/平均工作时间)
2. 队列大小考量：
  - 内存消耗：每个请求占用的内存 * 队列长度
  - 业务可接受的排队时间
  - 系统可承受的最大延迟

实际配置示例：

ThreadPoolExecutor executor = new ThreadPoolExecutor(
    corePoolSize,     // 核心线程数
    maximumPoolSize,  // 最大线程数
    60, TimeUnit.SECONDS,  // 空闲线程存活时间
    new LinkedBlockingQueue<>(queueCapacity),  // 工作队列
    new ThreadFactoryBuilder().setNameFormat("order-process-%d").build(),  // 线程工厂
    new ThreadPoolExecutor.CallerRunsPolicy()  // 拒绝策略
);

动态调整：根据系统负载情况，通过监控平台动态调整线程池参数

5. 秒杀系统架构设计

问题：如何设计高并发秒杀系统，保证高性能和数据一致性。

正确解答：

整体架构：
1. 前端层：
  - 静态资源CDN加速
  - 页面静态化，减少服务器渲染压力
  - 倒计时客户端实现，避免集中请求
2. 接入层：
  - Nginx负载均衡
  - 接口限流(Sentinel/Hystrix)
  - 请求校验和过滤
3. 服务层：
  - Redis计数器实现库存预检
  - 消息队列(RabbitMQ/Kafka)实现流量削峰
  - 分布式锁(Redis/Zookeeper)保证一致性
4. 数据层：
  - 读写分离
  - 热点数据本地缓存
  - 库存数据分片减少锁争用

关键技术点：

防止超卖：

// Redis Lua脚本实现原子减库存
String luaScript = "if (redis.call('exists', KEYS[1]) == 1) then " +
                  "    local stock = tonumber(redis.call('get', KEYS[1])); " +
                  "    if (stock >= tonumber(ARGV[1])) then " +
                  "        redis.call('decrby', KEYS[1], ARGV[1]); " +
                  "        return 1; " +
                  "    end; " +
                  "    return 0; " +
                  "end; " +
                  "return -1;";

消息队列异步处理：

@RabbitListener(queues = "order-queue")
public void processOrder(OrderMessage message) {
    try {
        // 幂等性检查
        if (redisTemplate.opsForValue().setIfAbsent("order:" + message.getOrderId(), "1", 24, TimeUnit.HOURS)) {
            orderService.createOrder(message);
        }
    } catch (Exception e) {
        // 异常处理和重试机制
        rabbitTemplate.convertAndSend("order-retry", message);
    }
}

6. 消息队列可靠性保障

问题：如何解决消息丢失和重复消费问题。

正确解答：

消息丢失解决方案：

生产者端：

消息发送确认机制(Publisher Confirm)
事务机制确保消息投递

// RabbitMQ确认机制
rabbitTemplate.setConfirmCallback((correlationData, ack, reason) -> {
    if (!ack) {
        // 重发消息或记录失败日志
        log.error("消息发送失败：" + reason);
        retryService.retryMessage(correlationData.getId());
    }
});

MQ服务端：
- 开启持久化配置
- 集群部署，主从复制

消费者端：

手动确认消息(manual ack)
消息处理成功后再确认

channel.basicConsume(QUEUE_NAME, false, (consumerTag, message) -> {
    try {
        // 处理消息
        processMessage(message);
        // 确认消息
        channel.basicAck(message.getEnvelope().getDeliveryTag(), false);
    } catch (Exception e) {
        // 拒绝消息并重新入队
        channel.basicNack(message.getEnvelope().getDeliveryTag(), false, true);
    }
}, consumerTag -> {});

重复消费解决方案：

全局消息ID：为每条消息生成全局唯一ID

幂等性处理：

数据库唯一索引
Redis SET NX操作
状态机控制

// 使用Redis实现幂等性检查
public boolean isProcessed(String messageId) {
    return Boolean.TRUE.equals(redisTemplate.opsForValue()
            .setIfAbsent("msg:processed:" + messageId, "1", 7, TimeUnit.DAYS));
}