大数据
文章平均质量分 66
蝉43301
你将来一定会感谢现在拼命的自己!!!
展开
-
hue打开workflow异常
hue打开workflow报错转载 2022-11-28 10:11:03 · 321 阅读 · 1 评论 -
【无标题】
阿里云集群扩容案例转载 2022-11-27 01:52:36 · 308 阅读 · 0 评论 -
【无标题】
centos7在线安装Mysql数据库时 没有可用软件包 mysql-community-server问题解决原创 2022-10-14 21:24:22 · 352 阅读 · 0 评论 -
spark入门
PySpark入门1.Spark介绍1.1spark的应用及使用1.2Spark的计算流程设计二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录二级目录三级目录1.Spark介绍Spark官网:https://spark.apache.org/定义:基于内存式计算的分布式统一化的数据分析引擎功能:数据分析引擎工具栈实现离线数据批处理,类似于MapReduce,写代码做处理实现交互式即时数据查询:类似于Hive、Presto、Impala,使原创 2022-06-07 22:08:21 · 1241 阅读 · 0 评论 -
大数据常见报错信息以及解决办法
大数据错误信息题集原创 2022-06-07 11:48:50 · 1358 阅读 · 0 评论 -
新零售数仓DM层实现操作
新零售数仓DM层实现操作1.按周统计2.按月统计3.按年来统计4.商品主题统计宽表5.RPT层实现6.数据导出操作7.使用presto完成数据导出8.展示1.按周统计insert into xxxx.dm_sale with dim_date as ( select date_code, year_code, year_month, month_code , day_month_num , dim_date_id , year_week_name_cn from h原创 2022-05-26 19:01:04 · 623 阅读 · 0 评论 -
数仓之新零售项目
新零售项目1.新零售概述1.1行业背景1.2业务模块介绍1.3clouderamanager工具介绍1.4项目环境部署操作1.5数据仓库的基本概念2.维度分析2.1维度分析的基本介绍3.数仓建模3.1数仓建模概念3.2常见的数仓建模理论3.3事实表3.4维度表3.5数仓发展模型3.6缓慢渐变维3.7数仓分层介绍4.数仓工具的基本使用4.1使用 HUE 操作 oozie4.2如何使用oozie4.3sqoop的基本使用操作4.3.1sqoop的概述4.3.2基本操作4.3.3数据全量导入操作4.3.4数据条件原创 2022-05-11 00:54:31 · 2622 阅读 · 3 评论