在拉钩学习的笔记(十)正则表达式

1、什么是正则表达式
    正则表达式:(Regular Expression)用于匹配规律规则的表达式,正则表达式最初是科学家对人类神经系统的工作原理的早期研究,现在在编程语言中有广泛的应用。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
    正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的集合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
    正则表达式的作用:
        1.给定的字符串是否符合正则表达式的过滤逻辑(匹配);
        2.可以通过正则表达式,从字符串中获取我们想要的特定部分(提取);
        3.强大的字符串替换能力(替换)。
    在线测试正则:https://c.runoob.com/front-end/854
2、正则表达式的语法
    在JavaScript中,正则表达式也是对象,是一种索引类型
    使用一个正则表达式字面量是最简单的方式。两个/是正则表达式的定界符
    你可以通过下面两种方法创建一个正则表达式:
        使用一个正则表达式字面量,var reg = /abc/;(正则表达式字面量在脚本加载后编译。若你的正则表达式是常量,使用这种方法可以获得更好的性能)
        调用RegExp对象的构造函数,var re = new RegExp("abc");
3、相关正则方法
    字符串的方法:
        split()         根据匹配字符串切割父字符串
        match()         使用正则表达式与字符串相比较,返回一个包含匹配结果的数组
        search()        对正则表达式或指定字符串进行搜索,返回第一个出现的匹配项的下标
        replace()       用正则表达式和字符串直接比较,然后用新的字符串来替换被匹配的字串
    正则表达式方法:
        exec()          在目标字符串中执行一次正则匹配操作
        test()          测试当前正则是否能匹配目标字符串
    ===============================
    String: split
        根据匹配字符串切割父字符串
    String: search
        寻找匹配字符串在父字符串中的位置
    String: match
        在父字符串中寻找匹配字符串
    String: replace
        替换父字符串中匹配字符串
    RegExp: exec
        在字符串中寻找匹配字符串,该方法比其他正则方法或字符串方法支持的更复杂;不论有没有全局修饰符,都只会在找到第一个之后停止
    RegExp: test
        检测字符串是否匹配正则表达式
4、正则表达式的组成
    由一些普通字符和一些特殊字符(又叫元字符--metacharacters)组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。
    特殊字符:javascript 中常用特殊字符有( ) [ ] { } \ ^ $ | ? * + .
    若想匹配这类字符必须用转移符号 \ 如:\(,\^,\\
    预定义特殊字符:
        \t          /\t/    制表符
        \n          /\n/    回车符
        \f          /\f/    换页符
        \b          /\b/    空格
5、字符集
    简单类:正则的多个字符对应一个字符,我们可以用[]把他们包括起来,让[]这个整体对应一个字符[abc]。 例如: o[usb]t --obt ost out
    范围类:有时匹配的东西过多,而且类型又相同,全部输入太麻烦,我们可以在中间加了个横线。 [a-z]、[0-9]、[A-Z]
    负向类:[]前面加个元字符进行取反,表示匹配不能为括号里面的字符。 [^a]
    组合类:允许用中括号匹配不同类型的单个字符。 [0-9a-b] 如果数字、大写字母、小写字母,按照顺序写可以缩写,[0-Z] 表示[0-9][A-Z]
6、修饰符
    g 修饰符用于全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
    i 修饰符用于执行对大小写不敏感的匹配
7、边界
    ^ 开头  表示限制开头,后面的正则内容匹配的结果必须出现在字符串开始(注意不能紧跟于左中括号的后面)
    $ 结尾  表示限制结尾,前面的正则内容匹配的结果必须出现在字符串结尾
    实际应用中,会同时限制开头和结尾
8、预定义类
    .       [^\n\r]         除了换行和回车之外的任意字符
    \d      [0-9]           数字字符
    \D      [^0-9]          非数字字符
    \s      [\t\n\x0B\f\r]  空白字符
    \S      [^\t\n\x0B\f\r] 非空白字符
    \w      [a-zA-Z_0-9]    单词字符(所有字母/数字/下划线
    \W      [^a-zA-Z_0-9]   非单词字符
9、量词
    {n}     硬性量词        对应零次或这n次
    {n,m}   软性量词        至少出现n次但不超过m次(中间不能有空格)
    {n,}    软性量词        至少出现n次(+的升级版)
    ?       软性量词        出现零次或一次
    *       软性量词        出现零次或多次(任意次)
    +       软性量词        出现一次或多次(至少一次)
10、分组
    虽然量词出现,能帮助我们处理一排紧密相连的同类字符。但是这是不够的的,我们用中括号表示范围内选择,大括号表示重复次数。如果想获取重复多个字符,我们就要用小括号进行分组了
    或操作符:可以使用竖线 (|) 字符表示或者的关系
        /a|bc/          匹配 a 或 bc 字符
        /(ab)+|(cd)+/   匹配出现一次或多次的 ab 或 cd
11、分组的反向引用
    反向引用标识是对正则表达式中的匹配组捕获的子字符串进行编号,通过“\编号(在表达式中)”,“$编号(在表达式外)”进行引用。从1开始计数
12、中文字符
    匹配中文:[\u4e00-\u9fa5]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值