时空碰撞优化系列·一

本文探讨了在业务场景中遇到的时间和空间碰撞计算痛点,分析了当前方案的问题,提出了一种新的优化思路。通过在SQL中进行时间、经度、纬度的三维划分,并利用数学逻辑减少重复计算,实现了全程并行计算和高效去重,解决了大数据量计算的效率和准确性问题。
摘要由CSDN通过智能技术生成

优化源于痛点(┬_┬)

有没有痛点取决于业务场景的需求;有多痛取决于当前方案对业务的契合度

让我们从业务场景①、当前方案②切入,联立①②来推导当前痛点③吧!

话不多说,开始分析

 

①业务场景:

1.需要计算时间和空间都在一定范围内的数据对,数据来源可能有多种类型,人、车、码等

2.计算需要并行进行,每次计算一天的数据量,大约亿级

 

②当前方案:

先按照前文的同行从时间上划分,然后按照geohash从空间上划分,在边界点处理上用的是先计算好所有数据的geohash映射,然后广播到所有节点

 

③当前痛点:

1.计算空间范围大的时候映射map会爆炸

2.计算过程大量重复,去重逻辑繁琐,浪费大量算力

 

那么问题来了,是否存在什么更合适的方案来解决这些痛点呢?

我想,是有的。

根据痛点③,反推我们的预期目标④;

根据目标④,尝试推导出优化思路⑤;

落地思路⑤,成为最终的优化方案⑥

 

④预期目标

1.不整串行计算,全程并行

2.避免重复计算,一键去重

 

⑤优化思路

1.直接在sql里分好片

2.从数学上逻辑推导来解决

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值