medical hub data center

最新推荐文章于 2023-11-06 12:10:43 发布

XiaoZhuSGM

最新推荐文章于 2023-11-06 12:10:43 发布

阅读量112

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/XiaoZhuSGM/article/details/113663272

版权

3 篇文章 0 订阅

订阅专栏

Medical Hub Data数据中心问题

通过其它aws服务，如s3对象事件、消息机制触发该服务，在本项目中是在lambda中驱动glue作业

应用部署服务器

通过aws s3 cli同步本地数据到s3，进入aws生态

数据同步
数据生产时点和数据load进数据库的时点不一致。业务人员看数据统计报告会出现漏数、指标不准的情况！对于etl来说，直接的策略是同步，检测源数据的更新，然后更新到目的地！当然程序的复杂度更高！现在性价比高的策略是控制etl任务的刷新间隔，譬如以天、小时启动任务。
标准不明确
何为正确的数据，往往业务人员也不太清楚！这就导致需求不断变化，开发不断的改逻辑，一直到能满足为业务所“用”为止。业务水平的在大多数情况下决定了数据可用性！

关注