shell命令比较一个文件是否是另一个的子集

最新推荐文章于 2021-10-14 11:21:31 发布

yulongli

最新推荐文章于 2021-10-14 11:21:31 发布

阅读量2.8k

点赞数

分类专栏：脚本编程文章标签： shell file 算法 unix 脚本

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yulongli/article/details/4940913

版权

脚本编程专栏收录该内容

0 篇文章 0 订阅

订阅专栏

有文件file1，file2，把文件中每行作为一个元素，比较file1的元素合是否是file2的元素合的子集。

最笨的方法莫过于此：

用c++写个程序，分别将两个文件中的内容读入到两个list中。然后循环查找，file1中的某行是否不存在于file2中，如果存在这么一行，则file1不是file2的子集，若不存在，则file1是file2的子集。

算法其实很简单，重要的是人的生产力，c++写这个代码编译调试，至少要半个小时，说不准还会有隐含的bug。

shell作为unix下自带的脚本语言，用其编码效率较高，出错概率较少。在不追求执行速度的前提下，用shell编写的程序可以很快的实现我的需求。

对于这个需求，可以分为三种情况来处理：

1）如果两个文件内容一模一样。

diff file1 file2

echo $?

如果返回值为0，说明两个文件一样，file1当然是file2的子集了

2）现实并不都是像（1）中那么美好，所以需要下面的指令。

num1=$(cat file1 | wc -l)
num2=$(sort file1 file2| uniq -d | wc -l)
if [ $num1 -le $num2 ];then
文件1是文件2的子集
else
文件1不是文件2的子集
fi

3）第（2）种情况存在bug，就是file1中如果有相同的行，此方法会判断出错，不得已，还得靠某种算法才行

sort file1 > 1.txt
sort file2 > 2.txt
num=$(cat 2.txt| wc -l)
for((i=0;i<$num;i++))
do
if [ "$lineA"x == "$lineB"x ];then
  read -u 3 lineA;
  read -u 5 lineB;
elif [ "$lineB"x == `echo -e "$lineA/n$lineB" | sort | head -1`x ];then
  read -u 5 lineB;
else
  ret=1
  echo "不等"
  i=$num
        fi
done 3<1.txt 5<2.txt
if [ $ret -eq 0 ]; then
echo "相等"
fi

综上，对于这个小程序，用c++是吃力不讨好，用shell才是物尽其用。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
shell命令比较一个文件是否是另一个的子集

有文件file1，file2，把文件中每行作为一个元素，比较file1的元素合是否是file2的元素合的子集。最笨的方法莫过于此：用c++写个程序，分别将两个文件中的内容读入到两个list中。然后循环查找，file1中的某行是否不存在于file2中，如果存在这么一行，则file1不是file2的子集，若不存在，则file1是file2的子集。算法其实很简单，重要的是人的生产
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。