数据仓库实战
项目的目标和意义
如何在海量的客户和海量的商品之间找到结合点,达成更多的电子交易。
能够在一定程度上促进消费。
睡覺了
我现在能做的,便是以一段拙劣的文字来祭奠我那段流逝的岁月
展开
-
项目需求
目录需求列表需求列表 模块 序号 (所有) 序号 (模块) 需求 基于日期的订单指标分析 1 1 统计2019年期间每个季度的销售订单笔数、订单总额 2 2 ...原创 2020-04-27 15:59:47 · 7234 阅读 · 2 评论 -
解决缓慢变化维—拉链表
什么是缓慢变化维(SCD)、1、缓慢变化维简介缓慢变化维,简称SCD(Slowly Changing Dimensions) 一些维度表的数据不是静态的,而是会随着时间而缓慢地变化(这里的缓慢是相对事实表而言,事实表数据变化的速度比维度表快) 这种随着时间发生变化的维度称之为缓慢变化维 把处理维度表数据历史变化的问题,称为缓慢变化维问题,简称SCD问题2、举例说明例如:用...原创 2020-05-07 14:56:05 · 9246 阅读 · 20 评论 -
Mysql导入Source数据库
首先要确保数据库存在,如果不存在则创建方法1 source# mysql -uroot -pEnter password:Welcome to the MySQL monitor. Commands end with ; or \g.Your MySQL connection id is 54467Server version: 5.6.36-log Source distr...原创 2020-05-04 12:02:12 · 6474 阅读 · 0 评论 -
基于地域的订单分类指标分析(思路指向)
5 1 获取全国、无商品分类维度的分交易类型数据 6 2 获取全国、无商品分类维度的不分交易类型的数据 itcast_payments -> itcast_orders -> itcast_orders_goods 7 3 获取全国、一级商品分类维度的分交易类型数据 itcast_payments -> itcast_orders -> ...原创 2020-04-27 20:24:36 · 7180 阅读 · 3 评论 -
项目需求(基于日期的订单指标分析)
目录统计2019年期间每个季度的销售订单笔数、订单总额• 统计2019年期间每个月的销售订单笔数、订单总额统计2019年期间每周一到周日的销售订单笔数、订单总额统计2019年期间每个季度的销售订单笔数、订单总额-- 统计2019年期间每个季度的销售订单笔数、订单总额select jidu.mgjdu as mgjdu, count(io...原创 2020-04-25 19:12:53 · 7247 阅读 · 0 评论 -
阶段一
目录电商行业分析电商行业技术特点电商业务系统简介项目简介项目架构项目环境介绍项目ER图原始表本项目ER图了解大数据离线数仓架构 了解项目部署环境(数据规模和集群规模) 了解项目ER图 了解项目需求电商行业分析近年来,中国的电子商务快速发展,交易额连创新高,电子商务在各领域的应用不断拓展和深化、相关服务业蓬勃发展、支撑体系不断健全完善、创新的动力...原创 2020-04-27 15:56:30 · 7778 阅读 · 1 评论 -
总体介绍
阶段一项目背景介绍了解行业背景、了解项目背景,项目架构介绍、技术选型,项目环境(数据/硬件)介绍,项目ER图、项目需求介绍。基于项目需求实现查询功能(写SQL)或整理出查询流程阶段二准备数据(Mysql->Hive)学习、掌握kettle的使用、使用kettle将项目需求所需的数据在MYsql同步到Hive使用sqoop,将剩余的数据在MYsql同步到Hive...原创 2020-04-27 15:47:27 · 7773 阅读 · 2 评论 -
数仓的含义
目录1. 什么是数仓?2.数据仓库和数据集市的概念3.数据仓库和数据集市之间的区别1. 什么是数仓?数仓 可以理解 为 :数据仓库 或者 数据集市那么 “数据仓库”的概念可以追溯到80 年代中期。从本质上讲,最初数据仓库是想为操作型系统到决策支持环境的数据流提供一种体系结构模型,并尝试解决和这些数据流相关的各种问题。在缺乏“数据仓库”体...原创 2020-04-27 15:43:19 · 8654 阅读 · 4 评论