背景
企业内多个C端系统造成了一些业务流程不统一、客户体验不一致,于是建设了业务中台来解决相关问题,建成后需要迁移多个系统的数据到业务中台,就涉及到了很多合并问题,业务上提了很多分析统计任务用于辅助决策合并规则。
这些统计分析工作基本都是一次性工作,这次用以后不会周期性执行。数据量在几千万级别,加上时间紧,技术侧考虑低投入来解决这些问题,所以并没有引入一些大数据例如MPP、spark等工具,加上数据量不大(单表最大三千万),所以仅仅依托mysql数据库来完成工作。
常用语句示例
分组查询统计
假定vehicle表,包含user_id和车架vin码
user表包含user_id和mobile
查一车被多人绑定
select vin,count(user_id) as '用户数量',from vehicle
group by vin having count(user_id) >=2;
这个语句查到了数量,如果还想把具体是哪些ID也列出来在一行,可以用下面语句:
select vin,count(user_id) as '用户数量',group_concat(user_id) as '用户列表' from vehicle
group by vin having count(user_id) >=2;
假定相同mobile的不同user_id为一个人,再分析
select vin,</