Shell脚本-正则表达式

最新推荐文章于 2024-09-27 12:05:02 发布

尽头海水逆流

最新推荐文章于 2024-09-27 12:05:02 发布

阅读量648

点赞数 27

分类专栏： Shel脚本文章标签： linux 云计算正则表达式

本文链接：https://blog.csdn.net/follow_0616/article/details/138900265

版权

Shel脚本专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、sort命令

以行为单位对文件内容进行排序，也可以根据不同的数据类型来排序

比较原则

从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出

sort [选项] 参数
cat file | sort 选项

常用选项

-n	按照数字进行排序
-r	反向排序
-u	等同于uniq，表示相同的数据仅显示一行
-t	指定字段分隔符，默认使用[Tab]键分隔
-k	指定排序字段
-o <输出文件>	将排序后的结果转存至指定文件
-f	忽略大小写，会将小写字母都转换为大写字母来进行比较
-b	忽略每行前面的空格

du -a 目录 | sort -nr

二、uniq命令

用于报告或者忽略文件中连续的重复行，常与 sort 命令结合使用

uniq [选项] 参数
cat file | uniq 选项

常用选项

-c	进行计数，并删除文件中重复出现的行
-d	仅显示连续的重复行
-u	仅显示出现一次的行

案例禁用爆破用户

#！/bin/bash

#先清空黑名单用户
echo > /etc/hosts.deny

#获取分析日志并排序统计的结果
SSHIP=$(cat /var/log/secure | grep "Failed password" | awk '{print $11}' | sort -n | uniq -c)
#根据换行符进行循环
IFS=$'\n'

for i in $SSHIP
do
  #登录失败的次数
  num=$(echo $i |awk '{print $1}')
  #登录失败的IP地址
  IP=$(echo $i |awk '{print $2}')
  #失败次数大于5
  if [ $num -gl 5 ]
    #输出爆破用户到禁用名单
    then echo "sshd:$IP" >> /etc/hosts.deny
  fi
done

#日志进行备份并清空
\cp -f /var/log/secure /opt/secure
echo > /var/log/secure


后续可用
crontab -e

三、tr命令

常用来对来自标准输入的字符进行替换、压缩和删除

tr [选项] [参数]
#参数：
#字符集1：指定要转换或删除的原字符集。当执行转换操作时，必须使用参数“字符集2”指定转换的目标字符集，但执行删除操作时，不需要参数“字符集2”；
#字符集2：指定要转换成的目标字符集。

常用选项

-c	保留字符集1的字符，其他的字符（包括换行符\n）用字符集2替换
-d	删除所有属于字符集1的字符
-s	将重复出现的字符串压缩为一个字符；用字符集2 替换字符集1
-t	字符集2 替换字符集1，不加选项同结果

tr -s "\n"        #删除空行
tr -s ":" "\n"        #把路径变量中的冒号":"，替换成换行符"\n"


#删除Windows文件中回车造成的'^M'字符：
cat 原文件名 | tr -s "\r" "\n" > 新文件名
或
cat 原文件名 | tr -d "\r" > 新文件名

linux内部软件dos2unix同样可以实现

四、数组排序

echo ${数组名{@]} | tr ' ' '\n' | sort -rn | tr '\n' ' '

五、cut命令

显示行中的指定部分，删除文件中指定字段

cat 文件名 | cut 选项

常用选项

-f	通过指定哪一个字段进行提取。cut命令使用“TAB”作为默认的字段分隔符
-d	“TAB”是默认的分隔符，使用此选项可以更改为其他的分隔符
--complement	此选项用于排除所指定的字段
--output-delimiter	更改输出内容的分隔符

#字符串分片

echo ${变量：下标：长度}        #下标起始从0开始
echo $变量 | cut -b 起始下标-终止下标        #下标起始从1开始
expr substr $变量 起始下标 长度        #下标起始从1开始

六、split命令

linux下将一个大的文件拆分成若干小文件

split 选项 参数 原始文件 拆分后文件名前缀

常用选项

–l	以行数拆分
–b	以大小拆分
-d	输出的目标文件后缀用数字代替

#将一个10G文件分割为10个1G文件
split -b 1G -d 原文件 目标文件名前缀

#将一个100行文件分割为10个10行的文件
split -l 10 -d 原文件 目标文件名前缀

七、paste命令

用于合并文件的列

paste [-s][-d <间隔字符>] 文件...

常用选项

-d<间隔字符>	用指定的间隔字符取代制表符
-s	把多行内容合并为一行进行显示

#合并文件的行
cat 文件1 文件2 ... > 新文件

#合并文件的列
paste -d '分隔符' 文件1 文件2 ... > 新文件

八、eval命令

命令字前加上eval时，shell会在执行命令之前扫描它两次。eval命令将首先会先扫描命令行进行所有的置换，然后再执行该命令。该命令适用于那些一次扫描无法实现其功能的变量。该命令对变量进行两次扫描

九、正则表达式

通常用于判断语句中，用来检查某一字符串是否满足某一格式

由普通字符与元字符组成

普通字符包括大小写字母、数字、标点符号及一些其他符号；
元字符是指在正则表达式中具有特殊意义的专用字符，可以用来规定其前导字符（即位于元字符前面的字符或表达式）在目标对象中的出现模式

基础正则表达式常见元字符（支持的工具：grep、egrep、sed、awk）

\	转义字符，用于取消特殊符号的含义例：\!、\n、\$等
^	匹配字符串开始的位置例：^a、^the、^#、^[a-z]
$	匹配字符串结束的位置例：word$、^$匹配空行
.	匹配除\n之外的任意的一个字符例：go.d、g..d
*	匹配前面子表达式0次或者多次例：good、go.d
[list]	匹配list列表中的一个字符例：go[ola]d，[abc]、[a-z]、[a-z0-9]、[0-9]匹配任意一位数字
[^list]	匹配任意非list列表中的一个字符例：[^0-9]、[^A-Z0-9]、[^a-z]匹配任意一位非小写字母
\{n\}	匹配前面的子表达式n次例：go\{2\}d、'[0-9]\{2\}'匹配两位数字
\{n,\}	匹配前面的子表达式不少于n次例：go\{2,\}d、'[0-9]\{2,\}'匹配两位及两位以上数字
\{n,m\}	匹配前面的子表达式n到m次例：go\{2,3\}d、'[0-9]\{2,3\}'匹配两位到三位数字
注：egrep、awk、grep -E、sed -r使用{n}、{n,}、{n,m}匹配时“{}”前不用加“\”
\w	匹配包括下划线的任何单词字符 \W ：匹配任何非单词字符。等价于“[^A-Za-z0-9_]”
\d	匹配一个数字字符 \D ：匹配一个非数字字符。等价于 [^0-9]
\s	空白符 \S ：非空白符

扩展正则表达式元字符（支持的工具：egrep、awk）

+	匹配前面子表达式1次以上例：go+d，将匹配至少一个o，如god、good、goood等
?	匹配前面子表达式0次或者1次例：go?d，将匹配gd或god
()	将括号中的字符串作为一个整体例：g(oo)+d，将匹配oo整体1次以上，如good、gooood等
\|	以或的方式匹配字符串例：g(oo\|la)d，将匹配good或者glad

案例1

02588888888
025-5555555555
025 12345678
025 54321678
025ABC88888
025-85432109
028-85643210
0251-52765421

#需求：区号025开头，号码与区号间可以是空格、-、没有，号码必须是5或者8开头的八位数


cat 文件名 | egrep "^(025)[ -]?[58][0-9]{7}$"

案例2

电子邮箱
用户名@子域名[.二级域名].顶级域

zhangsanl23@qq.com
li_si@163.com
wang@wudsina.com
zhao liu@126.com
qiangqi@sina.com.cn

#需求：用户名@:长度要求在6-18位，任意大小写英文，任意数字，除了@符号和空格以外的其它任意符号字符，开头只能是_或者字母
^[a-zA-Z_][^@ ]{5,17}@

#需求：子域名[.二级域名]:长度任意，符号只能包含-_.
([a-zA-Z0-9_\-\.]+)

#需求：顶级域名:长度在2-5，任意大小写英文
(\.[a-zA-Z]{2,5})$

#完整匹配
[a-zA-Z_][^@ ]{5,17}@([a-zA-Z0-9_\-\.]+)(\.[a-zA-Z]{2,5})$


cat 文件名 | egrep "[a-zA-Z_][^@ ]{5,17}@([a-zA-Z0-9_\-\.]+)(\.[a-zA-Z]{2,5})$"

尽头海水逆流

关注

27
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

+	匹配前面子表达式1次以上例：go+d，将匹配至少一个o，如god、good、goood等
?	匹配前面子表达式0次或者1次例：go?d，将匹配gd或god
()	将括号中的字符串作为一个整体例：g(oo)+d，将匹配oo整体1次以上，如good、gooood等
\|	以或的方式匹配字符串例：g(oo\|la)d，将匹配good或者glad