![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 62
denganming1214
这个作者很懒,什么都没留下…
展开
-
大数据汇总贴
大数据汇总贴一、hadoop二、hive三、spark四、数据仓库4.1、数据仓库和建模原创 2019-07-08 22:30:55 · 242 阅读 · 0 评论 -
大数据概述(1.1)
目录一、为什么要有大数据二、大数据的特点三、应用场景四、大致业务流程五、部门组织一、为什么要有大数据主要解决:海量数据的存储和分析计算二、大数据的特点大数据有4大特点,4V:数据量大Volume:企业能达到EB(1024TP)增长速度高速velocity多样化variety:结构化(业务数据)和非结构化(网络日志,音视频、图片、地理位置信息)低价值密度value:提纯是难题三...原创 2019-07-08 22:38:13 · 243 阅读 · 0 评论 -
hadoop概述(1.2)
目录一、Hadoop是什么二、三大论文三、hadoop三大发行版本四、hadoop的优势五、hadoop组成六、hdfs架构初步了解七、yarn架构八、MapReduce架构九、大数据生态圈一、Hadoop是什么Hadoop是一个由Apache基金会所开发的分布式系统基础架构。主要解决,海量数据的存储和海量数据的分析计算问题。二、三大论文由google发布的3大论文,被hadoop使用,形...原创 2019-07-08 22:45:34 · 290 阅读 · 0 评论 -
数据仓库和建模
代理键是由数据仓库处理过程中产生的、与业务本身无关的、唯一标识维度表中一条记录并充当维度表主键的列,也是描述维度表与事实表关系的纽带。在现实世界中,每一个操作型事件,基本都是发生在实体之间的,伴随着这种操作事件的发生,会产生可度量的值,而这个过程就产生了一个事实表,存储了每一个可度量的事件。订单表:(维度表主键)时间外建,用户外建,商品外键,(度量数据)下单数量、价格、(事件描述信息)状态、付款时间。事实表为订单表、子订单表,维度包括商品维度、用户维度、商家维度、区域维度、时间维度。原创 2019-07-04 18:11:36 · 2205 阅读 · 1 评论