Shell对比两个文件中的记录有多少重复

最新推荐文章于 2023-01-18 10:40:01 发布

weixin_34360651

最新推荐文章于 2023-01-18 10:40:01 发布

阅读量743

点赞数

文章标签： shell awk

原文链接：https://my.oschina.net/orion/blog/81169

版权

为什么80%的码农都做不了架构师？>>>

问题是这样的：

有两个uid的文件，格式如下：

uid1.txt

12345

23456

....

uid2.txt

12345

34567

....

需要统计这两个文件中相同的uid有多少个。

方法有两个：

1.一个是读入一个文件的一行然后再另一个文件中找，找到就加一，shell大概是这样的（未测试）

count=0
while read line：
do
  grep ${line} uid2.txt
  if [ "$?" -eq 0 ]
  then
      ((count++))
  fi
done < uid1.txt
echo "sum=${count}"

2、1容易想但是太慢，仔细想想可以用类似hash的方式实现，换用awk

awk '
BEGIN{sum=0;}
NR==FNR 
{
  m[$1]=1;
} 
(NR!=FNR && m[$1]==1 && n[$1] != 1) 
{
  n[$1] = 1;
  sum=sum+1;
} 
END{print "sum=",sum;}
' uid1.txt uid2.txt

文件大得话，速度提高不少。同时对于 1 如果有重复uid的话，会出现错误累加，所以在处理前最好先sort | unique一下，对于2 来说因为用n数组标记了所以，不用特殊处理了，速度上又是一个提高。

转载于:https://my.oschina.net/orion/blog/81169

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34360651

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Shell对比两个文件中的记录有多少重复

为什么80%的码农都做不了架构师？>>> ...
复制链接

扫一扫

Linux之shell常用命令（三） sort（排序）、uniq（处理重复字符）

weixin_43936969的博客

02-14

2017

文章目录shell中常用的命令—sort和uniq1.sort命令和uniq命令的用法2.命令的使用举例2.1sort的默认用法2.2 ==-n== 纯数字排序2.3 ==-rn== 倒序数字排序2.4 ==-o== 输出到指定文件中2.5 ==-u== 去掉重复数字2.6 ==sort -urn== 倒序去掉重复数字2.7 ==uniq -c== 每行显示一次并统计重复次数（左次数，右数据）2...

shell_profiles：我喜欢使用的Shell配置文件

02-13

在Linux或Unix系统中，主要有两个常用的Shell配置文件：`.bashrc`和`.bash_profile`。对于Bash Shell（最常用的Shell），`.bashrc`文件用于设置用户级别的Shell环境变量和别名，而`.bash_profile`则通常用于设置系统...

参与评论您还未登录，请先登录后发表或查看评论

Shell 命令求两个文件每行对比的相同内容

lyf0327的博客

11-03

1783

[root@lyf ~]# cat a.txt 1 2 3 4 [root@lyf ~]# cat b.txt 1 3 3 4 5 [root@lyf ~]# comm <(sort a.txt|uniq) <(sort b.txt|uniq) 1 2 3 4 5 由上可知，第一列表示第一个文件独有的内容，第二列表示第二个文件独有的内容，第三列表示两个文件共有的内容。以下命令只显示第三列共有的内容。 [root@lyf ~]# comm -12 <(sort a.tx

利用Shell脚本校验数据一致性

lumia98的博客

03-01

1175

#!/bin/bash ##################################### #检测两台服务器指定目录下的文件一致性 ##################################### #通过对比两台服务器上文件的md5值，达到检测一致性的目的 # 服务器需要校验的目录 current_dir=/data/tomcat # 远端服务器ip地址 des_ip=192.168.2.1 # 当前服务器的数据校验md5值 find $current_dir -type f|xarg

shell脚本示例：批量比较多个文件的内容是否相同

大叶子不小的博客

07-12

2149

https://www.cnblogs.com/f-ck-need-u/p/7430259.html bash&shell系列文章：http://www.cnblogs.com/f-ck-need-u/p/7048359.html 要比较两个文件的内容是否完全一致，可以简单地使用diff命令。例如： diff file1 file2 &>/dev/null;echo $? 但是diff命令只能给定两个文件参数，因此无法一次性比较多个文件(目录也被当作文件)，而且diff比较非

牛客-SHELL10-第二列是否有重复

こ Noahっ的博客

05-24

337

题干：给定一个 nowcoder.txt文件，其中有3列信息，如下实例，编写一个shell脚本来检查文件第二列是否有重复，且有几个重复，并提取出重复的行的第二列信息：实例： 20201001 python 99 20201002 go 80 20201002 c++ 88 20201003 php 77 20201001 go 88 20201005 shell 89 20201006 java 70 20201008 c 100 20201007 java 88 20201006 go 97 结果：

bash：记录我写的bash shell

01-31

- **管道**：`|`用于连接两个命令，将前一个命令的输出作为后一个命令的输入，如`ls | grep .txt`查找包含".txt"的文件。 ### 5. 错误处理与调试 - **错误处理**：`set -e`启用严格模式，使脚本在遇到错误时立即...

LINUX/UNIX Shell编程大作业

06-12

在Linux系统的/etc目录下有这样一个文件passwd，该文件...　你必须提交一份硬拷贝（有一个写上名字的装订好的封面）和一份含下面四个文件的电子拷贝（三份SHELL脚本和一份文本文件）。　menu、add、delete、passwd 　

shell学习必背

05-25

9. `diff`：比较两个文件的差异。 10. `find`：在指定目录下查找文件，`-name`指定文件名模式。 11. `cp`：复制文件。`-p`保留文件属性。 12. `ps`和`grep`：查看和过滤进程信息。 13. `>`和`>>`：重定向输出。`>`...

shell脚本学习指南[二](Arnold Robbins & Nelson H.F. Beebe著)

09-15

在Unix系统中，有两种打印命令集：Berkeley System V 和GNU/Linux中的`lp`系列命令。例如，`lpr -Plcb102 sample.ps` 将PostScript文件发送到名为lcb102的打印队列，`lpq -Plcb102` 查看队列状态，`lprm -Plcb102 8`...

手机号码两个文件对比重复整理，单个文件对比整理重复，Excel数据对比重复

05-03

两个文件对比重复号码，对比不重复号码，单个文件找出重复的号码，找出不重复的号码，数据去重，发短信的号码整理助手具体使用技巧参考博客：https://blog.csdn.net/bbyn1314/article/details/89788189

两个文本文件逐行比较文件内容找出独有文本行

03-30

两个文本文件逐行比较，找出比较文件中独有的文本行，并将它加入原文本文件中。

Shell命令比较2个文件的差异

m0_49047167的博客

03-29

6513

Shell比较两个文本

xiaoqixiaoguai的博客

01-18

2274

awk内置参数$0表示整行，$1,$2...分别表示各域，内置参数NR，表示记录的计数，awk '{print NR, $0}' file1 file2表示依次读取file1 file2，打印出每行，并且在前面添加行号。方法一中的前一部分，在文件file1中匹配模板来反向匹配文件file2中的内容，即输出文件file2中，在file1中没有内容。命令comm的功能就是逐行比较两个排序好的文件，默认输出有三列：只在file1中有的行，只在file2中有的行，file1和file2中共同有的部分。

Shell 命令行求两个文件每行对比的相同内容

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交