自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 hadoop fs 命令大全(解析和例子)

hadoop fs [generic options]hadoop fs -rm -f /tmp/luan/ 删除文件文件,不能删除目录 ---------------------------------------------------------------------------------------[-appendToFile <localsrc> ... <dst>]将本地文件的内容追加到给定的dst文件。hadoop fs -appendTo...

2021-12-08 15:33:03 10540

原创 SQL关键字执行顺序

SQL查询的执行顺序

2023-04-02 20:16:25 1595

原创 MapReduce中shuffle过程

MapReduce中shuffle过程

2023-04-02 16:53:55 903 1

原创 如何保持代码的整洁和优雅

代码整洁之道

2023-04-02 16:46:44 132

原创 对维度建模的思考和总结

维度模型中正确的做法是以最详细的力度表达数据,这样可以获得更好的灵活性和可扩展性。

2023-03-09 16:42:31 154

原创 阿里云弹性云桌面安装失败问题解决记录(.net framework 4.6.2 or later:Error Code: 12029)

.net framework 4.6.2 or later:Error Code: 12029

2022-01-05 11:37:01 4877

原创 yarn执行流程(大明版)

yarn运行流程

2021-12-28 16:10:29 1166

原创 数据仓库中压缩格式的分类

压缩的好处:1,就是节省磁盘空间,提升磁盘利用率。2,加速网络的传输。压缩的缺点:1,需要占用cpu资源进行压缩与解压。2,压缩与解压需要时间。压缩比和压缩速度是相反的。压缩速度从高到低:Snappy>LZ4>LZO>gzip>bzip2LZO:通过索引可切分。bzip2:可切分。gzip,LZ4,Snappy其他均不可切分。Snappy,LZ4,LZO针对压缩速度优化什么是不可切分?压缩数据只能用一个MAP处理,运行的时间可能会更长。详解: g...

2021-12-24 15:37:38 1319

原创 1,spark为什么比mapreduce运行速度快很多?

1、基于内存,减少大量的磁盘io操作。 mapreduce任务每次都会把结果数据落地到磁盘, 后续有其他的job需要依赖于前面job的输出结果, 这里就需要进行大量的磁盘io操作,获取前面job的输出结果。性能非常低 spark任务的输出结果可以保存在内存中, 后续有其他的job需要依赖于前面job的输出结果, 这里就只需要直接从内存中获取得到,大大减少磁盘io操作。 2、mapreduce任务启动进程,spark任务启动线程。线程可以重复使用同一个进程,...

2021-12-23 11:01:16 2202

原创 Flink 任务提交流程(一图流)

2021-12-10 14:00:26 1198

阿里云弹性云桌面安装失败问题解决 netframework4.6.2.zip

阿里云弹性云桌面安装失败问题解决记录(.net framework 4.6.2 or later:Error Code: 12029)

2022-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除