前言
之前负责的一个项目上线好久了,最近突然爆出一 Bug,最后评估影响范围将 Bug 升级成了故障,只因为影响的数据量有 10000 条左右,对业务方造成了一定的影响。
但因为不涉及到资金损失,Bug 修复后对数据进行修补,所以最终级别也是较低的。
今天和大家分享这个线上隐匿的 Bug,也好在工作的项目中得以借鉴哈~
需求背景
主题:民宿入住回访问卷
描述:
针对入住民宿的顾客,在离店后的当天或第二天内需要给顾客发送本次入住民宿的回访问卷,以此收集顾客入住体验的意见或建议
说明:
因为数据量较大,采用的是 Hive 库存储数据和逻辑加工
问题分析
1.业务逻辑
**t2表:**存储(昨日+今日此时)离店的顾客清单信息
**t3表:**存储已发送过回访问卷的顾客清单信息
出现 Bug 的核心业务逻辑如下:
所使用的等值关联字段为:
t2.id = t3.primary_id
从t2表
中过滤掉t3表
中的数据,通过使用t2表
作为主表left