- 博客(2)
- 收藏
- 关注
原创 离线数据、实时数据该如何选择
不管是离线数据还是实时数据最终都是为了解决业务场景下的问题,搞懂其差别和基本原理后,再去选择到底是实时还是离线,可以做到用最小的资源成本达成业务目标,而不是一味的追求实时,或者永远只能离线。数据从业务端产生,到分析或者说反哺业务使用,需要经过一系列的清洗、处理过程,而这个过程需要时间,时间的长短就是数据的时效性。这就好比,穿的袜子脏了就洗,今日事今日毕,而不是都攒着。离线数据一般是指T+1的日期,例如今天的日期T=2022-01-12,那么数据结果中,能够体现的业务数据只包括前一天的(昨日数据)。
2023-06-11 14:10:51 750
原创 数据分析汇总
1、解决数据孤岛,统一数据出口(避免多指标问题)2、解决查询数据慢的问题,数据量大,可以提前做汇总关系型数据库:MySQL、Oracle、postgreSQL、DB2 …非关系型数据库:Hbase、MongoDB、Redis ……直接找到哪一页去检索,避免全表扫描。提高查询速度,会影响where 和 order by索引是针对于字段的,需要添加到字段上常见索引分类:主键索引、唯一索引、普通索引、复合索引主键索引(了解): -- 创建主键字段的时候会自动创建主键索引。
2023-06-10 14:58:27 2961
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人