正则表达式 入门

正则表达式函数
1.regexp_like
功能:模糊匹配指定的字符串
2.regexp_replace
功能:将匹配获得的字符串替换成指定的字符串
3.regexp_instr
功能:获得匹配字符串的位置
4.regexp_substr
功能:提取指定字符串的子串

正则相关资料是朋友无偿提供的,如果有抄袭引用之处可留言
常用的正则表达式:
(1)??? “^\d+ "     / / 非 负 整 数 ( 正 整 数 + 0 ) ( 2 ) ? ? ? " [ 0 − 9 ] ∗ [ 1 − 9 ] [ 0 − 9 ] ∗ "  //非负整数(正整数 + 0) (2)??? "^[0-9]*[1-9][0-9]* "  //+02???"[09][19][09]”  //正整数
(3)??? “^((-\d+)|(0+)) "     / / 非 正 整 数 ( 负 整 数 + 0 ) ( 4 ) ? ? ? " − [ 0 − 9 ] ∗ [ 1 − 9 ] [ 0 − 9 ] ∗ "  //非正整数(负整数 + 0) (4)??? "^-[0-9]*[1-9][0-9]* "  //+04???"[09][19][09]”  //负整数
(5)??? “^-?\d+KaTeX parse error: Undefined control sequence: \d at position 21: …//整数 (6)??? "^\̲d̲+(\.\d+)?”  //非负浮点数(正浮点数 + 0)
(7)??? “^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))KaTeX parse error: Undefined control sequence: \d at position 24: …数 (8)??? "^((-\̲d̲+(\.\d+)?)|(0+(…”  //非正浮点数(负浮点数 + 0)
(9)??? “^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))KaTeX parse error: Undefined control sequence: \d at position 23: …点数 (10)? "^(-?\̲d̲+)(\.\d+)?”  //浮点数
(11)? “1+ "     / / 由 26 个 英 文 字 母 组 成 的 字 符 串 ( 12 ) ? " [ A − Z ] + "  //由26个英文字母组成的字符串 (12)? "^[A-Z]+ "  //2612?"[AZ]+”  //由26个英文字母的大写组成的字符串
(13)? “2+ "     / / 由 26 个 英 文 字 母 的 小 写 组 成 的 字 符 串 ( 14 ) ? " [ A − Z a − z 0 − 9 ] + "  //由26个英文字母的小写组成的字符串 (14)? "^[A-Za-z0-9]+ "  //2614?"[AZaz09]+”  //由数字和26个英文字母组成的字符串
(15)? “^\w+KaTeX parse error: Undefined control sequence: \w at position 39: …的字符串 (16)? "^[\̲w̲-]+(\.[\w-]+)*@…”    //email地址
(17)? “3+://(\w+(-\w+))(.(\w+(-\w+)))(?\S)? "     / / u r l ( 18 ) ? / ( d 2 ∣ d 4 ) − ( ( 0 ( [ 1 − 9 ] 1 ) ) ∣ ( 1 [ 1 ∣ 2 ] ) ) − ( ( [ 0 − 2 ] ( [ 1 − 9 ] 1 ) ) ∣ ( 3 [ 0 ∣ 1 ] ) ) "  //url (18)? /^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1])) "  //url18?/(d2d4)((0([19]1))(1[12]))(([02]([19]1))(3[01]))/?? //? 年-月-日
(19)? /^((0([1-9]{1}))|(1[1|2]))/((0-2)|(3[0|1]))/(d{2}|d{4}) / ? ? / / 月 / 日 / 年 ( 20 ) ? " ( [ w − . ] + ) @ ( ( [ [ 0 − 9 ] 1 , 3 . [ 0 − 9 ] 1 , 3 . [ 0 − 9 ] 1 , 3 . ) ∣ ( ( [ w − ] + . ) + ) ) ( [ a − z A − Z ] 2 , 4 ∣ [ 0 − 9 ] 1 , 3 ) ( ] ? ) /?? // 月/日/年 (20)? "^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?) /??////20?"([w.]+)@(([[09]1,3.[09]1,3.[09]1,3.)(([w]+.)+))([azAZ]2,4[09]1,3)(]?)”?? //Emil
(21)? /^((+?[0-9]{2,4}-[0-9]{3,4}-)|([0-9]{3,4}-))?([0-9]{7,8})(-[0-9]+)? / ? ? ? ? / / 电 话 号 码 ( 22 ) ? " ( d 1 , 2 ∣ 1 d d ∣ 2 [ 0 − 4 ] d ∣ 25 [ 0 − 5 ] ) . ( d 1 , 2 ∣ 1 d d ∣ 2 [ 0 − 4 ] d ∣ 25 [ 0 − 5 ] ) . ( d 1 , 2 ∣ 1 d d ∣ 2 [ 0 − 4 ] d ∣ 25 [ 0 − 5 ] ) . ( d 1 , 2 ∣ 1 d d ∣ 2 [ 0 − 4 ] d ∣ 25 [ 0 − 5 ] ) /???? //电话号码 (22)? "^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]) /????//22?"(d1,21dd2[04]d25[05]).(d1,21dd2[04]d25[05]).(d1,21dd2[04]d25[05]).(d1,21dd2[04]d25[05])"?? //IP地址
(23)? ?
(24)? 匹配中文字符的正则表达式: [\u4e00-\u9fa5]
(25)? 匹配双字节字符(包括汉字在内):[^\x00-\xff]
(26)? 匹配空行的正则表达式:\n[\s| ]\r
(27)? 匹配HTML标记的正则表达式:/<(.
)>.</\1>|<(.) />/
(28)? 匹配首尾空格的正则表达式:(^\s*)|(\s*KaTeX parse error: Undefined control sequence: \w at position 26: …配Email地址的正则表达式:\̲w̲+([-+.]\w+)*@\w…
(31)? 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):4[a-zA-Z0-9_]{4,15}$
(32)? 匹配国内电话号码:(\d{3}-|\d{4}-)?(\d{8}|\d{7})?
(33)? 匹配腾讯QQ号:5[1-9][0-9]$
(34)? 元字符及其在正则表达式上下文中的行为:
(35)? \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个后向引用、或一个八进制转义符。
(36)? ^ 匹配输入字符串的开始位置。如果设置了 RegExp 对象的Multiline 属性,^ 也匹配 ’\n’ 或 ’\r’ 之后的位置。
(37)? $ 匹配输入字符串的结束位置。如果设置了 RegExp 对象的Multiline 属性,$ 也匹配 ’\n’ 或 ’\r’ 之前的位置。
(38)? * 匹配前面的子表达式零次或多次。
(39)? + 匹配前面的子表达式一次或多次。+ 等价于 {1,}。
(40)? ? 匹配前面的子表达式零次或一次。? 等价于 {0,1}。
(41)? {n} n 是一个非负整数,匹配确定的n 次。
(42)? {n,} n 是一个非负整数,至少匹配n 次。
(43)? {n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗号和两个数之间不能有空格。
(44)? ? 当该字符紧跟在任何一个其他限制符 (, +, ?, {n}, {n,}, {n,m}) 后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。
(45)? . 匹配除 “\n” 之外的任何单个字符。要匹配包括 ’\n’ 在内的任何字符,请使用象 ’[.\n]’ 的模式。
(46)? (pattern) 匹配pattern 并获取这一匹配。
(47)? (?:pattern) 匹配pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(48)? (?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。
(49)? (?!pattern) 负向预查,与(?=pattern)作用相反
(50)? x|y 匹配 x 或 y。
(51)? [xyz] 字符集合。
(52)? [^xyz] 负值字符集合。
(53)? [a-z] 字符范围,匹配指定范围内的任意字符。
(54)? [^a-z] 负值字符范围,匹配任何不在指定范围内的任意字符。
(55)? \b 匹配一个单词边界,也就是指单词和空格间的位置。
(56)? \B 匹配非单词边界。
(57)? \cx 匹配由x指明的控制字符。
(58)? \d 匹配一个数字字符。等价于 [0-9]。
(59)? \D 匹配一个非数字字符。等价于 [^0-9]。
(60)? \f 匹配一个换页符。等价于 \x0c 和 \cL。
(61)? \n 匹配一个换行符。等价于 \x0a 和 \cJ。
(62)? \r 匹配一个回车符。等价于 \x0d 和 \cM。
(63)? \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
(64)? \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
(65)? \t 匹配一个制表符。等价于 \x09 和 \cI。
(66)? \v 匹配一个垂直制表符。等价于 \x0b 和 \cK。
(67)? \w 匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’。
(68)? \W 匹配任何非单词字符。等价于 ’[^A-Za-z0-9_]’。
(69)? \xn 匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。
(70)? \num 匹配 num,其中num是一个正整数。对所获取的匹配的引用。
(71)? \n 标识一个八进制转义值或一个后向引用。如果 \n 之前至少 n 个获取的子表达式,则 n 为后向引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。
(72)? \nm 标识一个八进制转义值或一个后向引用。如果 \nm 之前至少有is preceded by at least nm 个获取得子表达式,则 nm 为后向引用。如果 \nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的后向引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 \nm 将匹配八进制转义值 nm。
(73)? \nml 如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八进制转义值 nml。
(74)? \un 匹配 n,其中 n 是一个用四个十六进制数字表示的Unicode字符。
(75)? 匹配中文字符的正则表达式: [u4e00-u9fa5]
(76)? 匹配双字节字符(包括汉字在内):[^x00-xff]
(77)? 匹配空行的正则表达式:n[s| ]r
(78)? 匹配HTML标记的正则表达式:/<(.
)>.
</1>|<(.) />/
(79)? 匹配首尾空格的正则表达式:(^s
)|(s*KaTeX parse error: Can't use function '\u' in math mode at position 871: …匹配中文字符的正则表达式: [\̲u̲4e00-\u9fa5] (…)
(93)? 匹配IP地址的正则表达式:/(\d+).(\d+).(\d+).(\d+)/g //
(94)? 匹配Email地址的正则表达式:\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
(95)? 匹配网址URL的正则表达式:http://(/[\w-]+.)+[\w-]+(/[\w- ./?%&=])?
(96)? sql语句:^(select|drop|delete|create|update|insert).
$
(97)? 非负整数:^\d+$
(98)? 正整数:6[1-9][0-9]$
(99)? 非正整数:^((-\d+)|(0+))$
(100)? 负整数:^-[0-9][1-9][0-9]$
(101)? 整数:^-?\d+$
(102)? 非负浮点数:^\d+(.\d+)?$
(103)? 正浮点数:^((0-9)+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
(104)? 非正浮点数:^((-\d+.\d+)?)|(0+(.0+)?))$
(105)? 负浮点数:^(-((正浮点数正则式)))$
(106)? 英文字符串:7+$
(107)? 英文大写串:8+$
(108)? 英文小写串:9+$
(109)? 英文字符数字串:10+$
(110)? 英数字加下划线串:^\w+$
(111)? E-mail地址:11+(.[\w-]+)@[\w-]+(.[\w-]+)+$
(112)? URL:12+://(\w+(-\w+)
)(.(\w+(-\w+)))(?\s*)?$
或:http://[A-Za-z0-9]+.[A-Za-z0-9]+[/=?%-&_~`@[]’:+!]*([<>""])$
(113)? 邮政编码:13\d{5}$
(114)? 中文:14+$
(115)? 电话号码:^(((\d{2,3}))|(\d{3}-))?((0\d{2,3})|0\d{2,3}-)?[1-9]\d{6,7}(-\d{1,4})?$
(116)? 手机号码:^(((\d{2,3}))|(\d{3}-))?13\d{9}$
(117)? 双字节字符(包括汉字在内):^\x00-\xff
(118)? 匹配首尾空格:(^\s
)|(\s*KaTeX parse error: Undefined control sequence: \/ at position 49: …TML标记:<(.*)>.*<\̲/̲\1>|<(.*) \/> …/
(133)? 腾讯QQ号:15[1-9][0-9]$
(134)? 帐号(字母开头,允许5-16字节,允许字母数字下划线):16[a-zA-Z0-9_]{4,15}$
(135)? 中文、英文、数字及下划线:17+$?

问题一:样例数据:对样例数据进行清洗:
1.REGEXP_REPLACE(table_name,’,[0-9]T|,[0-9]R|[{}()]+’,’’)
|在这里插入图片描述

后续待更新…


  1. A-Za-z ↩︎

  2. a-z ↩︎

  3. a-zA-z ↩︎

  4. a-zA-Z ↩︎

  5. 1-9 ↩︎

  6. 0-9 ↩︎

  7. A-Za-z ↩︎

  8. A-Z ↩︎

  9. a-z ↩︎

  10. A-Za-z0-9 ↩︎

  11. \w- ↩︎

  12. a-zA-Z ↩︎

  13. 1-9 ↩︎

  14. \u0391-\uFFE5 ↩︎

  15. 1-9 ↩︎

  16. a-zA-Z ↩︎

  17. \u4e00-\u9fa5_a-zA-Z0-9 ↩︎

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值