对数据文件操作命令

1.分割文件

-l 以行数分割train.txt 保存为out.txtxx

split -l 128113 train.txt out.txt

-C 以文件大小分割train.txt 保存为out.txtxx

 split -C 100M train.txt out.txt

2.按文件第一个数字升序排序

-n 以数字升序排序train.txt 保存为out.txtxx

sort -n train.txt > out.txt

3.提取前几列

$1表示前1列,提取train.txt前1列保存到out.txt

awk '{print $1}' train.txt >out.txt

4.在文件前加入一列指定字符串

在train.txt中,第一列添加train

sed -i 's/^/train &/g' train.txt

5.显示行号

从0开始编号,显示行号

:'<,'>s/^/\=line('.') - line("'<") + 0/

6.合并文件

将out1和out2合并为out3

cat out1.txt out2.txt >out3.txt

7.全文替换字符串

将文件中的abc全部替换为efg

:%s/abc/efg/g

8.nohup写入指定文件

默认写入nohup.out文件

nohup python run.py &    

指定写入output文件

nohup python run.py>output 2>&1 & 
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值