自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 总结hdfs核心原理

1.架构2.读流程3.上传流程4.namenode与datanode通信

2022-04-06 22:45:05 77

原创 总结111

2022-04-05 22:43:02 81

原创 用户画像开发

1、用户画像分类 (这里基于技术开发视角)基于统计类的标签 :基本属性标签 、活跃度标签、消费订单标签等基于规则类的标签 :用户粘性级别、用户活跃度等级、用户价值等级等基于挖掘类的标签 :用户流失风险、用户职业属性、用户性格等2、基于统计标签用户活跃标签开发示例-- 用户活跃区间表hive> desc mall_app_uac_range;OKguid bigintfirst_login_dt stringrang

2022-04-03 23:12:02 197

原创 atlas和dolphinscheduler 安装

atlas元数据管理系统功能 技术元数据的自动摄取 靠在大数据组件上配置钩子hook 自动摄取到的元数据都是技术元数据 血缘回溯 血缘含义 就是一个数据实体(hive表、字段)它的来源及它的后代 血缘关系的获取 钩子获取insert语句后解析得到血缘关系 atlas能追踪到表级别的血缘,...

2022-04-01 22:21:11 1935

原创 维度建模1

1.维度建模主要用于数仓建模,数据分析2.我们一般根据所需要做的主题分析里面的度量,树立一张中心事实表,然后根据计算所需要的维度,构建各种维度表,然后进行关联形成一张宽表,最后对这张宽表进行报表统计3.维度建模模型: 雪花模型 星型模型 星座模型星型模型:只有一张事实表 和各种不同的维度表,事实表和维度表只会有一层关联关系,这些维度表都是反范式的扁平化维表雪花模型: 只有一张事实表 和各种不同的维度表 ,事实表和维度表关联一般都会关联多层,才会得到最后所需要的维度,这些维度表一般都是符合三范

2022-03-31 22:26:58 125

原创 业务域数据导入数仓

业务域数据导入到数仓sqoop增量数据导入bin/sqoop import \--connect jdbc:mysql://linux01:3306/myword \--username root \--password root \--target-dir /sqoopdata/t_md_areas \ --中间存储在hdfs 的目录--hive-import \ --hive-database mydata \ --存入hive的数据库--hive-tabl...

2022-03-30 22:45:03 2138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除