Linux统计所有文件夹内名称出现次数

待统计文件格式

/path//.txt
.txt文件格式为:间隔为>=1个空格,数目不定,名称内无空格

type probability name

目的

统计所有文件夹内,指定路径下的txt文件,统计每个文件夹内name出现的次数,输出到一个文件中

脚本实现

#!/bin/bash  

# 定义输出文件  
output_file="output.txt"  

# 清空输出文件  
truncate -s 0 "$output_file"  

# 遍历指定目录下的所有文件夹  
for dir in /path/*; do  
    # 检查是否是目录  
    if [ -d "$dir" ]; then  
        # 定义关联数组来跟踪name的计数  
        declare -A name_count  

        # 遍历目录下的所有.txt文件  
        for file in "$dir"/path/to/*.txt; do  
            # 检查是否是文件  
            if [ -f "$file" ]; then  
                # 读取文件内容  
                while IFS= read -r line; do  
                    name=$(echo "$line" | awk '{print $3}')  
                    if [[ -n "$name" ]]; then  
                        # 累加name出现的次数  
                        ((name_count["$name"]++))  
                    fi  
                done < "$file"  
            fi  
        done  
        
        # 将结果写入输出文件  
        for name in "${!name_count[@]}"; do  
            echo "$(basename "$dir"),$name,${name_count[$name]}" >> "$output_file"  
        done  
    fi  
done

执行

sh script.sh /path/to/input/folder /path/to/output.txt

输出文件

folder1,name1,2
folder1,name2,1
folder2,name2,4

优化

可以根据用户输入指定输出文件、输出目录等

#!/bin/bash  

# 检查是否提供了输入文件夹和输出文件名  
if [ "$#" -ne 2 ]; then  
    echo "用法: $0 <输入文件夹路径> <输出文件名>"  
    exit 1  
fi  

input_dir="$1"  
output_file="$2"  

# 清空输出文件  
truncate -s 0 "$output_file"  

# 遍历指定目录下的所有文件夹  
for dir in "$input_dir"/*; do  
    # 检查是否是目录  
    if [ -d "$dir" ]; then  
        # 定义关联数组来跟踪name的计数  
        declare -A name_count  

        # 遍历目录下的指定路径下的所有.txt文件, 
        for file in "$dir"/path/to/*.txt; do  
            # 检查是否是文件  
            if [ -f "$file" ]; then  
                # 读取文件内容  
                while IFS= read -r line; do  
                    name=$(echo "$line" | awk '{print $3}')  
                    if [[ -n "$name" ]]; then  
                        # 累加name出现的次数  
                        ((name_count["$name"]++))  
                    fi  
                done < "$file"  
            fi  
        done  
        
        # 将结果写入输出文件  
        for name in "${!name_count[@]}"; do  
            echo "$(basename "$dir"),$name,${name_count[$name]}" >> "$output_file"  
        done  
    fi  
done

注:也可以定义输出文件分隔符

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值