1常见的命令
1.1sort
sort sort命令可针对文本文件的内容,以行为单位来排序。
1.2unip
uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort 命令结合使用
删除重复的行并排序统计
统计只显示一次的行
1.3tr
tr 常用来对来自标准输入的字符进行替换、压缩和删除。
1.4cut
cut 显示行中的指定部分,删除文件中指定字段
1.5split
split 将一个大的文件拆分成
-l 以行数拆分
-b 以大小拆分
2正则表达式
2.1正则表达式的定义
正则表达式,又称正规表达式、常规表达式
使用字符串来描述、匹配一系列符合某个规则的字符串
正则表达式的组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符
2.2常见的元字符
常见的元字符有find、grep、egrep、sed和awk等
2.3扩展正则表达式
支持的工具:egrep、awk 或 grep -E 和 sed -r
2.4位置符号