shell 统计大文件中某列每个字符出现的字数

对于几百万条记录的文件,用python处理起来会慢很多,这时候可以结合awk grep 等使用

需求:获取2020001082.snp_indel.hg19_multianno.pro.txt 文件中第十列中每次字符的个数

#!/bin/bash
#for i in `cut -f 10 2020001082.snp_indel.hg19_multianno.pro.txt|sort |uniq -d   # 这句总是报告代码最后一行的下面一行Syntax error: EOF in backquote substitution 错误提示 
cut -f 10 2020001082.snp_indel.hg19_multianno.pro.txt|sort |uniq -d|while read i
do
	echo -n "${i} number is \n"  >> count.result.txt
	awk '{print $10}' 2020001082.snp_indel.hg19_multianno.pro.txt|grep "${i}"|wc -l  >> count.result.txt
done

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值