TsukiQWQ
码龄2年
关注
提问 私信
  • 博客:4,587
    4,587
    总访问量
  • 9
    原创
  • 95,586
    排名
  • 37
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖北省
  • 毕业院校: 湖北第二师范学院
  • 加入CSDN时间: 2022-09-23
博客简介:

m0_73893402的博客

查看详细资料
  • 原力等级
    当前等级
    2
    当前总分
    87
    当月
    15
个人成就
  • 获得73次点赞
  • 内容获得2次评论
  • 获得72次收藏
  • 代码片获得266次分享
创作历程
  • 9篇
    2024年
成就勋章
兴趣领域 设置
  • Python
    python
  • Java
    java
  • 大数据
    sqldatabasemysqlhadoophiverediszookeepersparkflumekafkabig dataflinkhdfssqoop数据仓库etletl工程师数据库开发
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

数据仓库问题记录

作用:支持后续在datagrip中连接hive数据库。在终端中启动hive的第2代客户端。
原创
发布博客 2024.12.27 ·
157 阅读 ·
9 点赞 ·
0 评论 ·
4 收藏

Hive总结

数据倾斜是由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点的现象。主要表现为:任务进度长时间维持在 99%或者 100%的附近,查看任务监控页面,发现只有少量 reduce 子任务未完成,因为其处理的数据量和其他的 reduce 差异过大。单一 reduce 处理的记录数和平均记录数相差太大,通常达到好几倍之多,最长时间远大于平均时长。
原创
发布博客 2024.10.04 ·
965 阅读 ·
13 点赞 ·
0 评论 ·
19 收藏

如何解决hive中文注释乱码问题

下面修改是在MySQL中修改,因为。
原创
发布博客 2024.09.26 ·
183 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

论数据开发对建模的理解

解决方案:拆,将只和某一个字段的列拆成另一张表存储,如该案例中,我们可以将性别和住址拆成学生表中,将学分拆成课程表中。这里我们不难发现,学生的性别住址和所选的课程并没有关系,而学分只和课程有关,跟学生没有关系,所以他们部分依赖于主键,那么我们应该怎么让这个表变得满足3NF中的唯一性呢?这里我们发现,在学生列中,可以拆分成三列,为姓名,性别,住址,所以并不满足3NF中的原子性。至此,我们成功解决了将一个不满足3NF的表转换成多个满足3NF的表,该过程为范式建模的思想。定义:非主键值不能依赖于另一个非主键值。
原创
发布博客 2024.09.24 ·
649 阅读 ·
15 点赞 ·
0 评论 ·
7 收藏

窗口函数中的范围规定

当窗口函数不使用order by的时候, 默认的作用范围为所有, 而使用order by且不自定义范围的时候, 默认为从头到当前行聚合, 那么如何规定窗口函数范围呢?
原创
发布博客 2024.09.18 ·
391 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

hive常用的窗口函数

首先, 在列举窗口函数之前, 我们需要知道, 什么是窗口函数, 这里只是谈一谈我的理解, 通俗的理解方式。先附上规范的定义:窗口函数,也叫OLAP函数(Online Anallytical Processing,联机分析处理),可以对数据库数据进行实时分析处理。再来说说我的理解:窗口函数格式: xxx解释: 在数据库查询中的select后使用, 在这后面再加一列。
原创
发布博客 2024.09.18 ·
762 阅读 ·
17 点赞 ·
0 评论 ·
27 收藏

Pyspark学习笔记

这里是我在学习Spark中的一些个人整理的笔记, 所以全文都只是我的个人理解,可能会出现错误,也有可能并不是那么的规范。这里并没有完全写完,因为这是我在学习的过程中写的,后续会不断的补充和修正。
原创
发布博客 2024.08.12 ·
352 阅读 ·
5 点赞 ·
0 评论 ·
6 收藏

关于使用pycharm运行spark出现JAVA_HOME is not set问题

这种方法虽然不需要任何配置, 但是每次写程序的时候都要去之前的程序中找到这么一大串代码贴到新的程序中, 想想都是比较折磨的, 这里问了问chatGPT, 又参考了网上的一些解决方案, 最终总结出第二种解决方案.未找到的问题就可以解决了, 可以按照个人需求来决定使用哪一种方案.
原创
发布博客 2024.08.10 ·
491 阅读 ·
2 点赞 ·
2 评论 ·
2 收藏

关于centOS系统yum下载失败的问题

2. 排查是否是因为网络不通才出现的问题,解决方案是访问百度, 如果不报错就进行之后的操作, 如果报错则配置网络。1. 确保使用root用户进行操作, 并打开resolv.conf添加DNS地址。至此, 在我平时的应用中关于yum下载问题就解决了。6. 测试yum是否能正常工作。4. 清理之前的yum缓存。3. 替换国内yum源。
原创
发布博客 2024.08.10 ·
600 阅读 ·
4 点赞 ·
0 评论 ·
2 收藏