大数据
文章平均质量分 86
魔界小皮蛋
代码就像人生,敲着敲着就老了,不行了
展开
-
数仓题目1.0
数仓题目1、能否简介一下当前这个项目包含:•项目做了什么项目叫做:知行教育大数据分析平台(数仓开发项目)目的:对海量的业务数据进行指标分析。结果:对分析的结果做可视化的展示•用到了什么技术Hive ,Hue,Cloudera Manager,HDFS,Oozie,YARN,Zookeeper,Sqoop,拉链表…•解决了什么问题1.将各种数据源整合到一起统一数据中心,解决数据壁垒。2.保留历史变更数据,提供对细节变化分析支持。3.脏数据清洗,简化业务复杂结构数据。•用于哪个行业?行原创 2021-01-15 09:27:44 · 2261 阅读 · 0 评论 -
clouderaManager----知行教育大数据分析平台(mysql---------ods)
hive中要做的事创建数据库create database ods;、–设置一些配置alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;– 修改分区字段注解alter table PARTITION_PARAMS m原创 2020-12-28 20:44:52 · 638 阅读 · 1 评论 -
大数据 hdfs 详解
17、HDFS适用场景1、海量数据存储2、高容错3、商用廉价的硬件4、存储大文件5、一次写入多次读取18、HDFS不适用场景1、查询时效性要求低延迟的场景2、需要频繁修改数据的场景3、大量小文件。4、多个用户同时操作一个文件19、Fsimage,Edits的作用Fsimage,Edits用于永久存储HDFS文件系统的镜像和操作日志。集群在二次启动时,使用Fsimage,Edits将集群恢复到关闭前的状态。20、secondaryNameNode如何辅助管理FSImage与E原创 2020-10-17 12:23:58 · 748 阅读 · 1 评论