![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库
文章平均质量分 52
zhenzigis
理工男,直性子
展开
-
数据的使用的三个层次
数据的使用有三个层次,你的企业处在哪个层次呢?原创 2023-05-31 10:11:16 · 208 阅读 · 0 评论 -
大数据开发要学习的各种组件
Spark SQLSpark SQL 是 Spark 处理结构化数据的程序模块。它将 SQL 查询与 Spark 程序无缝集成,可以将结构化数据作为 Spark 的 RDD 进行查询。RDD 的全称为 Resilient Distributed Datasets,即弹性分布式数据集,是 Spark 基本的数据结构。Spark 使用 RDD 作为分布式程序的工作集合,提供一种分布式共享内存的受限形式。RDD 是只读的,对其只能进行创建、转化和求值等操作。SparkSQL作为Spark生态的一员继续发展,而不原创 2021-10-20 19:12:18 · 1262 阅读 · 0 评论 -
大数据分析-智能消息推送策略
1:指标异常:单个指标数据异常,如销量突降,完成率差额过大、同比降幅过大,指标有明显上升、库存过大等2、排名提醒:只提醒排名靠后的几个3、数据周报:以故事的方式展示某分公司(或总部)的数据概况,主要展示要点,简明扼要(图在5个左右)—需要设计页面并开发4、指标关系异常:如产品结构销量异常,销量明显增加但收入却下降,5、系统消息:版本更新,维护通知等消息要有针对性,除系统消息外,避免消息批...原创 2020-03-06 14:10:28 · 4806 阅读 · 0 评论 -
数据治理之死(一)
最近这两年一直在做报表开发,从起先的PC端,到之后的大屏、手机、PAD,做来做去,其实差不多,很多报表是重复性的,只是表现形式上变化而已,而且多是那种中国式报表,领导又想做的和国外的报表一样好看,又想功能全面,在一个图里展现复杂的数据结构,并且有非常丰富的交互,即是数据都不达到,全是红色,也要那种深浅不一的红(我叫它五颜六色的红)。一个图柱子要叠起来,可以拖动时间,并且有两个纵轴指标,点击可以下钻...原创 2019-07-15 09:32:25 · 3355 阅读 · 2 评论 -
数据治理之死(二)
也许,上文饱含太多悲观的言语,而我又不是一个消极的人,不想给别人留下悲观的情绪,只是把现实的问题摆出来而已。国内做数据中台算的上成功的就是BAT了,至于传统公司,迄今没有一个真正建成。阿里和腾讯的做法差不多,架构图也很像,百度虽然没啥名气,却也自成一系,百度更多的是得益于计算中心。而华为,一开始只是做数据湖,所有的数据都扔到湖里,然后在DAYU里做分析,讲究的是数据与平台分离,在原有数据上重新定...原创 2019-08-02 09:14:04 · 2566 阅读 · 0 评论