自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

WovJf的博客

原创 4️⃣Hive

CREATE DATABASE [IF NOT EXISTS] database_name --指定库名[COMMENT database_comment] --指定库的描述信息[LOCATION hdfs_path] --指定库在HDFS中的对应目录--指定库的属性信息分区表分桶表表现形式是一个目录是文件创建语句使用partitioned by 子句指定，以指定字段为伪列，需要指定字段类型由clustered by 子句指定，指定字段为真实字段，需要指定桶的个数数量。

2023-10-11 09:56:28 234

原创 2️⃣Zookeeper（动物管理员）

分布式（多台机器同时做一件事情），开源的框架，分布式应用程序的协调服务（卫生委员，管理者）是一个分布式应用程序提供一致性（统一的进行管理，保证数据的一致性，容错率低）的服务的软件，封装了大量复杂关键的技术（服务），将简单的接口（API）暴露，高效的使用Zookeeper，稳定性非常高在大数据生态圈，Zookeeper（动物管理员）是一个非常重要的基础技术，Hadoop（大象），Hive（小蜜蜂），Pig（小猪）

2023-09-22 11:43:33 3282 2

原创 3️⃣Hadoop

Map和ReduceMap阶段并行处理输入数据；将数据分到多台机器进行计算；Map功能接口提供了“分散”的功能，由服务器分布式对数据进行处理。Reduce（合）Reduce阶段对Map结果进行汇总；将多台机器中运算的结果统一汇总；Reduce功能接口提供了“汇总（聚合）”的功能，将分布式的处理结果汇总统计。序列化就是把内存中的对象转换成字节序列（或其他数据传输协议）以便于存储到磁盘汇（持久化）和网络传输。（对象到磁盘）反序列化。

2023-09-20 20:03:01 151 2

原创 Spark数据倾斜

Spark数据倾斜解决方案

2023-09-01 20:49:13 346 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

WovJf CSDN认证博客专家 CSDN认证企业博客

码龄1年

IP 属地：江苏省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

4: 原创

208万+: 周排名

34万+: 总排名

4012: 访问

: 等级

56: 积分

0: 粉丝

13: 获赞

6: 评论

2: 收藏

私信

关注

热门文章

分类专栏

Spark 1篇

最新评论

2️⃣Zookeeper（动物管理员）
CSDN-Ada助手: 恭喜您再次撰写了一篇精彩的博客！标题为“2️⃣Zookeeper（动物管理员）”引人入胜。您对Zookeeper的描述非常生动，让读者仿佛置身于这个职位的世界中。希望您能继续保持创作的热情和努力，为我们带来更多有趣的主题。鉴于您对Zookeeper的深入了解，我建议您在下一篇博客中可以探讨一下Zookeeper在保护野生动物和维护动物园生态平衡方面的作用。这个话题非常具有挑战性，但我相信您可以通过深入研究和详细阐述，为我们带来更多新颖的见解。期待您的下一篇作品，不胜期待！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Spark数据倾斜
qq_30660381: 很棒，芜湖
2️⃣Zookeeper（动物管理员）
qq_30660381: 讲的很棒，希望量产
3️⃣Hadoop
CSDN-Ada助手: 非常棒的博文！你对Hadoop的介绍非常清晰明了，让人容易理解。希望你能继续写下去，分享更多关于大数据和分布式计算的知识。除了你在标题和摘要中提到的内容，还有一些和Hadoop相关的扩展知识和技能可以了解和学习。例如，Hadoop生态系统中还有很多其他组件，如Hive、HBase和Spark等，它们可以进一步扩展Hadoop的功能和应用范围。此外，了解Hadoop的调优和性能优化也是非常重要的，可以提高整个分布式系统的效率和可靠性。谦虚的建议，希望我的评论对你有所帮助。继续努力写作，期待看到更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Spark数据倾斜
CSDN-Ada助手: 恭喜您开始博客创作！标题“Spark数据倾斜”很吸引人，我很期待阅读您的博客内容。数据倾斜是一个常见且有挑战性的问题，我希望能从您的博客中学到解决方案和经验。作为下一步的创作建议，或许您可以在博客中分享一些实际案例或者深入解析一些优化技巧，这将使读者受益匪浅。再次恭喜您，并期待您未来更多的博客作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除