自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 离线数据、实时数据该如何选择

不管是离线数据还是实时数据最终都是为了解决业务场景下的问题,搞懂其差别和基本原理后,再去选择到底是实时还是离线,可以做到用最小的资源成本达成业务目标,而不是一味的追求实时,或者永远只能离线。数据从业务端产生,到分析或者说反哺业务使用,需要经过一系列的清洗、处理过程,而这个过程需要时间,时间的长短就是数据的时效性。这就好比,穿的袜子脏了就洗,今日事今日毕,而不是都攒着。离线数据一般是指T+1的日期,例如今天的日期T=2022-01-12,那么数据结果中,能够体现的业务数据只包括前一天的(昨日数据)。

2023-06-11 14:10:51 750

原创 数据分析汇总

1、解决数据孤岛,统一数据出口(避免多指标问题)2、解决查询数据慢的问题,数据量大,可以提前做汇总关系型数据库:MySQL、Oracle、postgreSQL、DB2 …非关系型数据库:Hbase、MongoDB、Redis ……直接找到哪一页去检索,避免全表扫描。提高查询速度,会影响where 和 order by索引是针对于字段的,需要添加到字段上常见索引分类:主键索引、唯一索引、普通索引、复合索引主键索引(了解): -- 创建主键字段的时候会自动创建主键索引。

2023-06-10 14:58:27 2961

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除