SHELL13 去掉所有包含this的句子
代码
sed '/this/d'
知识点
这里为什么不能写成:
sed '/[this]/d'
如果加了[],指的是这个语句含有字母:t/h/i/s
SHELL10 第二列是否有重复
代码
awk '{print $2}' nowcoder.txt | sort | uniq -cd | sort -n
知识点
- awk ‘{print $2}’ nowcoder.txt指的是提取nowcoder.txt中的第二列
- sort指的是对nowcoder.txt中的第二列进行排序 Linux uniq 命令用于检查及删除文本文件中重复出现的行列,一般与 sort命令结合使用。
- uniq 可检查文本文件中重复出现的行列。
- -c或–count 在每列旁边显示该行重复出现的次数。
- -d或–repeated 仅显示重复出现的行列。
- -f<栏位>或–skip-fields=<栏位> 忽略比较指定的栏位。
- -s<字符位置>或–skip-chars=<字符位置> 忽略比较指定的字符。
- -u或–unique 仅显示出一次的行列。
- -w<字符位置>或–check-chars=<字符位置> 指定要比较的字符。 Linux sort 命令用于将文本文件内容加以排序。sort 可针对文本文件的内容,以行为单位来排序。
- -b 忽略每行前面开始出的空格字符。
- -c 检查文件是否已经按照顺序排序。
- -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
- -f 排序时,将小写字母视为大写字母。
- -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
- -m 将几个排序好的文件进行合并。
- -M 将前面3个字母依照月份的缩写进行排序。
- -n 依照数值的大小排序。
- -u 意味着是唯一的(unique),输出的结果是去完重了的。
- -o<输出文件> 将排序后的结果存入指定的文件。
- -r 以相反的顺序来排序。
- -t<分隔字符> 指定排序时所用的栏位分隔字符。
- +<起始栏位>-<结束栏位> 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位 [-k field1[,field2]] 按指定的列进行排序。
SHELL9 统计每个单词出现的个数
代码
tr ' ' '\n' | sort | uniq -c | sort -nk1 | awk '{print $2, $1}'
知识点
- Linux tr 命令用于转换或删除文件中的字符。
- -c, --complement:反选设定字符。也就是符合 SET1 的部份不做处理,不符合的剩余部份才进行转换
- -d, --delete:删除指令字符
- -s, --squeeze-repeats:缩减连续重复的字符成指定的单个字符
- -t, --truncate-set1:削减 SET1 指定范围,使之与 SET2 设定长度相等
- 第一个sort对分割后的单词进行排序,这样是为uniq进行准备
- sort -nk1是根据第一列来进行排序
- awk '{print $2, $1}'是因为单词次数在第一列 单词在第二列 这里需要将两列调换后再输出
SHELL12 打印每一行出现的数字个数
代码
idx=1
sum=0
for line in $(cat nowcoder.txt)
do
num=$(echo $line | grep -o [1-5] | wc -l)
echo line$idx number:$num
let "sum+=num"
let "idx++"
done
echo sum is $sum
知识点
- 使用cat nowcoder.txt结合for可以来遍历文件的每一行
- Linux grep 命令:用于查找文件里符合条件的字符串。
- grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep 指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
- 参数:
- -a 或 --text : 不要忽略二进制的数据。
- -A<显示行数> 或 --after-context=<显示行数> : 除了显示符合范本样式的那一列之外,并显示该行之后的内容。
- -b 或 --byte-offset : 在显示符合样式的那一行之前,标示出该行第一个字符的编号。
- -B<显示行数> 或 --before-context=<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前的内容。
- -c 或 --count : 计算符合样式的列数。
- -C<显示行数> 或 --context=<显示行数>或-<显示行数> : 除了显示符合样式的那一行之外,并显示该行之前后的内容。
- -d <动作> 或 --directories=<动作> : 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
- -e<范本样式> 或 --regexp=<范本样式> : 指定字符串做为查找文件内容的样式。
- -E 或 --extended-regexp : 将样式为延伸的正则表达式来使用。
- -f<规则文件> 或 --file=<规则文件> : 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
- -F 或 --fixed-regexp : 将样式视为固定字符串的列表。
- -G 或 --basic-regexp : 将样式视为普通的表示法来使用。
- -h 或 --no-filename : 在显示符合样式的那一行之前,不标示该行所属的文件名称。
- -H 或 --with-filename : 在显示符合样式的那一行之前,表示该行所属的文件名称。
- -i 或 --ignore-case : 忽略字符大小写的差别。
- -l 或 --file-with-matches : 列出文件内容符合指定的样式的文件名称。
- -L 或 --files-without-match : 列出文件内容不符合指定的样式的文件名称。
- -n 或 --line-number : 在显示符合样式的那一行之前,标示出该行的列数编号。
- -o 或 --only-matching : 只显示匹配PATTERN 部分。
- -q 或 --quiet或–silent : 不显示任何信息。
- -r 或 --recursive : 此参数的效果和指定"-d recurse"参数相同。
- -s 或 --no-messages : 不显示错误信息。
- -v 或 --invert-match : 显示不包含匹配文本的所有行。
- -w 或 --word-regexp : 只显示全字符合的列。
- -x --line-regexp : 只显示全列符合的列。
- -y : 此参数的效果和指定"-i"参数相同。
- grep -o [1-5]指的是匹配字符串中有1-5之间的数字
SHELL11 转置文件的内容
代码
awk '{print $1" "}' nowcoder.txt
awk '{print $2" "}' nowcoder.txt
知识点
- print $1指的是输出每一行的第一列
SHELL14 求平均值
代码
awk '{
if (NR != 1){
sum += $1
}
} END {
printf("%0.3f\n", sum/(NR-1))
}'
知识点
- END前面的代码是遍历数组的每个元素
- END代表遍历结束,来算出平均数
- "%0.3f\n"为保留三位小数的正则表达
SHELL8 统计所有进程占用内存大小的和
代码
awk '{sum += $6}END{printf(sum)}' nowcoder.txt
知识点
与SHELL14类似