2.1 Linux 数据处理

1.grep是Globally search a Regular Expression and Print的缩写,意思是《全局搜索一个正则表达式,并且打印》。
1.1 grep text file
-i参数:忽略大小写
-n参数:显示行号
-v参数:只显示文本不在的行
-r参数:在所有子目录和子文件中查找
为了让grep命令知道我们要使用正则表达式,须要加上-E参数
2.sort命令:为文件排序
2.1 -o参数:将排序后的内容写入新文件
-r参数:倒序排列
-r参数中的r是reverse的缩写,是《相反,反面》的意思。与普通的仅用sort命令正好相反。
-R参数:随机排序
任意排序,每次都不一样可能。但在有些时候,还是很有用的。
-n参数:对数字排序
对数字的排序有点特殊。默认地,仅用sort命令的时候,是不区分首字符是否是数字的,因此还是按照1-9的顺序来排序。例如138会排在25前面,因为1排在2的前面。
不加 -n 的话按照正常的由小到大的顺序排序
3.wc命令:文件的统计
-l参数:统计行数
-w参数:统计单词数
-c参数:统计字节数
-m参数:统计字符数
4.uniq命令:删除文件中的重复内容
uniq 将结果输出到新文件
uniq newfile oldfile
-c参数:统计重复的行数
-d参数:只显示重复行的值

5.cut命令:剪切文件的一部分内容
-c参数:根据字符数来剪切
比如说,每一行只保留第2至第4个字符。可以这样做:
$ cut -c 2-4 name.txt
-d参数:d是delimiter的缩写,是《分隔符》的意思。用于指定用什么分隔符(比如逗号,分号,双引号等等)。
-f参数:f是field的缩写,是《区域》的意思。表示剪切下用分隔符分隔的哪一块或哪几块区域。
$ cut -d ,, -f 1 note.txt   # 每个分隔符号是,, 取每次分隔后的第一个区域中的内容。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值