令人奔溃的数据和业务逻辑

最新推荐文章于 2024-07-23 14:05:29 发布

薛晓刚

最新推荐文章于 2024-07-23 14:05:29 发布

阅读量44

点赞数

文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuexiaogang/article/details/131819547

版权

前段时间不经意间看到一个数据库的日志，我将这个日志进行简化和脱敏。

可能有人会说这个没有索引，是全表扫描。其实这个和索引没关系。

不知道大家有没有觉得奇怪？为什么时间不一样，但是每次的行数都是一样的？关键是扫描行数和返回行数一模一样。（真实的数据是好几万行的扫描和好几万行的返回）

我不相信每天产生的数据一条不差。这个和是不是有索引没有关系。

这个时候我第一感觉就是，看看表里面的数据是什么样的吧？

查看我脱敏的样例数据。

怎么样是不是很吃惊？

再看看表结构，这下明白了吧？这个数据类型就根本不对。

我见过用字符串表示时间的，这个是我极力反对的。这个无论在什么数据库上一般都不是好的选择。

当然用UNIX时间戳也不是不可以，最起码比字符串好。可惜这个ETL并不知道源数据是什么。还是按照date类型处理。结果就是这样了。

另外一个好奇点是，每次这样拿过去的数据有意义吗？因为完全不是实际的数据，根本对不上。或许这个业务重要程度低，无所谓数据对错了。

所以ETL处理数据要考虑很多事情，而避免这些问题最好的方式就是使用OGG等技术方案做日志级别同步，或者采用HTAP的解决方案。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
令人奔溃的数据和业务逻辑

为什么时间不一样，但是每次的行数都是一样的？（真实的数据是好几万行的扫描和好几万行的返回）另外一个好奇点是，每次这样拿过去的数据有意义吗？因为完全不是实际的数据，根本对不上。所以ETL处理数据要考虑很多事情，而避免这些问题最好的方式就是使用OGG等技术方案做日志级别同步，或者采用HTAP的解决方案。我见过用字符串表示时间的，这个是我极力反对的。前段时间不经意间看到一个数据库的日志，我将这个日志进行简化和脱敏。我不相信每天产生的数据一条不差。这个时候我第一感觉就是，看看表里面的数据是什么样的吧？
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。