Linux shell（数组-循环-echo）

最新推荐文章于 2024-01-30 11:51:42 发布

Jinandawang

最新推荐文章于 2024-01-30 11:51:42 发布

阅读量3.2k

点赞数

分类专栏： # Linux 文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/Jinandawang/article/details/131430992

版权

Linux 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

该Bash脚本定义了表名和月份的数组，然后循环遍历每个表和月份，使用hadoopfs-du-s命令统计Hive表在不同时间点的数据占用空间，并将结果追加到output.txt文件中。脚本处理了特定年份（2022和2023年）的数据，并使用awk和paste命令进行数据处理。

摘要由CSDN通过智能技术生成

#!/bin/bash
# 定义表名数组
tables=("表名1" "表名2" "表名3" "表名4" "表名5")

months=("01" "02" "03" "04" "05" "06" "07" "08" "09" "10" "11" "12" )

# 循环统计每个表每个月占用空间大小
for table in ${tables[@]}
do
    echo $table >> output.txt
	for month in ${months[@]}
		do
			echo -n "2022${month}* " >> output.txt
			hadoop fs -du -s "/user/hive/warehouse/$table/city=*/time=2022${month}*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
		done
    echo -n "202301* " >> output.txt
	hadoop fs -du -s "/user/hive/warehouse/cell.db/$table/city=*/time=202301*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
    echo -n "202302* " >> output.txt
	hadoop fs -du -s "/user/hive/warehouse/cell.db/$table/city=*/time=202302*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
    echo -n "202303* " >> output.txt
	hadoop fs -du -s "/user/hive/warehouse/cell.db/$table/city=*/time=202303*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
    echo -n "202304* " >> output.txt
	hadoop fs -du -s "/user/hive/warehouse/cell.db/$table/city=*/time=202304*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
    echo -n "202305* " >> output.txt
	hadoop fs -du -s "/user/hive/warehouse/cell.db/$table/city=*/time=202305*" | awk '{print $2}' | paste -s -d"+" - | bc >> output.txt
done

数组tables 和 months 的定义
for in 这种循环结构的使用（可以有别的表达形式）
echo 的 -n 表示不换行输出
>> 表示追加到文件（>是覆盖）
值得注意的地方在于：一开始使用 sh 文件名.sh 执行文件总显示syntax报错，这是因为在系统中sh被重定向（重命名）了，ls -l /bin/*sh 就可以看到具体的重定向情况，可以将sh 改用 bash或者别的方式执行。