hive
YuBx
热爱是藏不住的、
展开
-
电商数据仓库—系统业务数仓
电商数据仓库—系统业务数仓电商常识SKU(库存量基本单位):指具体某一个商品。SPU(商品信息聚合的最小单位):指某一类的商品。系统业务数仓涉及的表(8个)用户表(user_info):属于实体表,需要全量表同步标签含义id用户idname姓名birthday生日gender性别email邮箱user_level用户等级create_time创建时间订单表(order_info):属于周期型事实表,需要增量及原创 2020-11-02 11:38:54 · 512 阅读 · 0 评论 -
大数据数仓工具之Hive
Hivehive基本概念hive是一个数据仓库工具,可以将结构化的数据映射为一张表,并提供类SQL查询功能hive本质是将HQL转换为MapReduce程序hive分析数据的底层的实现是MapReduce,执行程序运行在Yarn上hive元数据存储在Mysql,数据本身存储在HDFS上hive的优缺点优点:基于SQL类似的语法避免了MapReduce编程处理海量数据比较有优势hive支持根据需求来自定义函数缺点:hive的HQL表达能力有限数据挖掘方面不擅长hive执原创 2020-10-17 14:01:07 · 373 阅读 · 0 评论