梁二狗的垒码生活
码龄4年
关注
提问 私信
  • 博客:1,053
    1,053
    总访问量
  • 3
    原创
  • 1,886,969
    排名
  • 3
    粉丝
  • 0
    铁粉

个人简介:编程小白一枚

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2020-09-19
博客简介:

alopeds的博客

查看详细资料
个人成就
  • 获得4次点赞
  • 内容获得2次评论
  • 获得0次收藏
创作历程
  • 2篇
    2023年
  • 1篇
    2022年
成就勋章
兴趣领域 设置
  • Python
    python
  • Java
    java
  • 大数据
    hadoophivekafka大数据
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hive的拉链表

每天都会有用户注册,产生新的用户信息,我们每天都需要将MySQL中的用户数据同步到Hive数据仓库中,在做用户分析时,需要对用户的信息做统计分析,例如统计新增用户的个数、总用户个数、用户性别分布、地区分布、运营商分布等指标。,没有发生更新的数据不进行状态存储,用于存储所有数据在不同时间上的所有状态,通过时间进行标记每个状态的生命周期,查询时,根据需求可以获取指定时间范围状态的数据,默认用9999-12-31等最大值来表示最新状态。构建拉链表,通过时间标记发生变化的数据的每种状态的时间周期。
原创
发布博客 2023.08.25 ·
77 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

Hive知识点总结

Hive复习复习~
原创
发布博客 2023.08.25 ·
383 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

bigdata-file-viewer-master.zip

发布资源 2022.10.09 ·
zip

大数据开发面试总结(部分),希望可以帮到大家!

涵盖HDFS、MR、YARN、Flume、Sqoop、Hive、Zookeeper、数仓的一些概念。
原创
发布博客 2022.10.09 ·
593 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏