![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 70
爱吃喵的虎
这个作者很懒,什么都没留下…
展开
-
HBase总结
HBase的架构和读写流程分析,keyrow的设计,大小合并,region的拆分原创 2022-09-23 10:11:24 · 846 阅读 · 1 评论 -
mapreduce和spark的工作机制及其shuffle的工作机制
mapreduce工作机制和shuffle的原理,spark的shuffle的工作机制原创 2022-09-21 21:49:54 · 697 阅读 · 0 评论 -
大数据组件的启动方式以及端口号总结
各种大数据组件的启动方式以及端口号总结。主要是Hadoop生态圈的组件,其中Hadoop2.x和Hadoop3.x的端口号差别较大原创 2022-09-15 22:54:19 · 1444 阅读 · 0 评论 -
SparkSQL的文件加载和保存
SparkSQL的文件加载和保存方法,包括通用方法和基本方法原创 2022-09-08 18:53:26 · 2114 阅读 · 1 评论 -
SparkSql自定义udaf函数
高版本(3.0):注册函数方式。低版本:采用DSL风格查询。一、弱类型(低版本3.0以下)二、强类型(3.0后推荐使用)原创 2022-09-08 16:39:57 · 597 阅读 · 0 评论