shell利用awk从文件中随机选取n行

7 篇文章 0 订阅
3 篇文章 0 订阅

工作中经常需要在文件中随机抽取几行的数据来分析,但是公司的虚拟机不支持连外网,同时没有shuf工具。
但是默认是有awk工具的。

创建一个shell脚本,内容如下:

#!/bin/bash

IN_FILE=$1
LINE_NUM=$2
awk -vN=${LINE_NUM} -vC="`wc -l ${IN_FILE}`" 'BEGIN{srand();while(n<N){i=int(rand()*C+1);if(!(i in a)){a[i]++;n++}}}NR in a' ${IN_FILE}

然后sh my_shuf.sh in_file_name line_num即可。

如果还需要打印某行的某列,后面管道接上awk就行,美滋滋~
例如:
sh my_shuf.sh datas.txt 100 | awk '{print $1}' > random_data_100

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值