Alluxio功能测试

最新推荐文章于 2024-03-12 14:24:39 发布

黑眼圈@~@

最新推荐文章于 2024-03-12 14:24:39 发布

阅读量585

点赞数

分类专栏：架构文章标签： big data hdfs hive spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45681127/article/details/120261695

版权

架构专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、功能测试

0）查看命令

alluxio fs ls /cos alluxio fs cat /cos/t

1）上传文件到alluxio

alluxio fs copyFromLocal /local /alluxio 下载到本地 alluxio fs copyToLocal /alluxio /local

本地上传数据到alluxio映射的cos上。

alluxio fs copyFromLocal dt=2021-09-06 /cos/shaiwu_check/

2） alluxio文件持久化到HDFS

alluxio fs persist /anaconda-ks.cfg hadoop fs -ls /alluxio

持久化的过程中，文件状态是TO_BE_PERSISTED

3）释放alluxio的文件

alluxio fs free /anaconda-ks.cfg

4）重新加载HDFS文件到alluxio文件

alluxio fs load /anaconda-ks.cfg

5）删除alluxio的文件

alluxio fs rm /anaconda-ks.cfg

6)注册主动监听，同步hdfs上文件变动(2.0功能，1.8qing)

监控alluxio的根目录 alluxio fs startSync /

7）在alluxio上复制文件

alluxio fs cp /xx.txt /xxx.txt 通过Alluxio将数据从COS上拉取到HDFS

8）将底层系统挂载到Alluxio

alluxio fs mount alluxioPath ufsPath

9）Pin锁定文件不释放,释放则报错

2、数据处理功能

1）hive建表

create table x( name string ) LOCATION 'alluxio://127.0.0.1:19998/cos/shaiwu_check'; #alluxio://alluxio-master:port/path

2）Spark等引擎获取数据

spark-sql> select article_id,count(1) from bi_app.dwd_zdm_alluxio_content_shaiwu_check group by article_id limit 10;

写入

insert overwrite table test.xxx partition(dt='2021-09-02') select 字段a,字段b,....字段z from test.xxxx where dt='2021-09-03';

查看写入后的底层，均在内存当中。

2、性能测试

读取870W数据

简单聚合(count操作)操作 Alluxio比HDFS 快 0.5秒

复杂聚合(多次聚合开窗)操作 Alluxio比HDFS 快 5秒

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Alluxio功能测试

1、功能测试0）查看命令alluxio fs ls /cos alluxio fs cat /cos/t1）上传文件到alluxioalluxio fs copyFromLocal /local /alluxio 下载到本地 alluxio fs copyToLocal /alluxio /local本地上传数据到alluxio映射的cos上。alluxio fs copyFromLocal dt=2021-09-06 /cos/shaiwu_check/2）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。