【shell编程入门】正则表达式

资料加载中

于 2024-01-21 22:36:10 发布

阅读量738

点赞数 6

文章标签：正则表达式 shell

本文链接：https://blog.csdn.net/qq_44091004/article/details/135736259

版权

正则表达式

特殊字符	描述
`[]`	方括号表达式，表示匹配的字符集合，例如 `[0-9]`、`[abcde]`
`()`	标记子表达式起止位置
`*`	匹配前面的子表达式零或多次
`+`	匹配前面的子表达式一或多次
`?`	匹配前面的子表达式零或一次
`\`	转义字符，除了常用转义外，还有：`\b` 匹配单词边界；`\B` 匹配非单词边界等
`.`	匹配除 `\n`（换行）外的任意单个字符
`{}`	标记限定符表达式的起止。例如 `{n}` 表示匹配前一子表达式 n 次；`{n,}` 匹配至少 n 次；`{n,m}` 匹配 n 至 m 次
`\|`	表明前后两项二选一
`$`	匹配字符串的结尾
`^`	匹配字符串的开头，在方括号表达式中表示不接受该方括号表达式中的字符集合

正则表达式实例

匹配Email地址

^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

^[a-zA-Z0-9._%+-]+的解释：

^: 表示匹配字符串的开头。
[a-zA-Z0-9._%+-]: 是一个字符类，包含了大小写字母（a-zA-Z）、数字（0-9）以及一些特殊字符（._%+-）。
+: 表示前面的字符类中的字符可以出现一次或多次。

这个正则表达式的含义是：匹配以大小写字母、数字、点（.）、下划线（_）、百分号（%）、加号（+）或减号（-）开头的字符串。

匹配身份证号码

^(^[1-9]\d{5}(18|19|20)\d{2}(0[1-9]|1[0-2])([0-2][1-9]|10|20|30|31)\d{3}(\d|X|x)$

^[1-9]\d{5} 是一个正则表达式，用于匹配一个六位的正整数。让我们解释一下这个正则表达式的各个部分：

^: 表示匹配字符串的开头。
[1-9]: 匹配第一个字符是1到9之间的任意一个数字。
\d: 匹配任意数字（等同于[0-9]）。
{5}: 表示前一个元素（\d）必须重复出现5次。

shell脚本与正则表达式结合的实例

有一个文本文件 data.txt 包含一些数据，每一行都有一个字符串，你想从中提取符合特定条件的数据。

#!/bin/bash

# 文件路径
file="data.txt"

# 匹配并提取所有包含数字的行
echo "Lines containing numbers:"
grep -E "[0-9]" "$file"

# 匹配并提取所有包含邮箱地址的行
echo -e "\nLines containing email addresses:"
grep -E "\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b" "$file"

# 匹配并提取所有包含日期的行 (YYYY-MM-DD)
echo -e "\nLines containing dates (YYYY-MM-DD):"
grep -E "\b\d{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])\b" "$file"

# 匹配并提取所有以"Product:"开头的行，提取产品名称
echo -e "\nProduct names:"
grep -E "^Product: (.+)$" "$file" | sed -E 's/^Product: (.+)$/\1/'

# 匹配并提取包含特定关键字的行，并统计其出现次数
keyword="important_keyword"
echo -e "\nLines containing the keyword '$keyword' and their count:"
grep -E "$keyword" "$file" | tee /dev/tty | wc -l