正则表达式
正则表达式正则表达式正则表达式
GUI Research Group
机器学习, 生物信息
展开
-
正则表达式匹配汉字
学习笔记转载自:如何用正则表达式匹配汉字正则表达式:[\u4E00-\u9FA5\\s]+ #匹配多个汉字,包括空格[\u4E00-\u9FA5]+ #匹配多个汉字,不包括空格[\u4E00-\u9FA5] #匹配一个汉字转载 2020-10-02 21:49:10 · 2706 阅读 · 0 评论 -
初识Mysql(part7)--我需要知道的5个关于正则的小知识
学习笔记,以代码和例子堆砌而成,方便查阅。参考书籍:《Mysql必知必会》等要点:REGEXP关键字、BINARY关键字、转义、字符类因为正则表达式笔者专门写了一系列Blog,所以这里对正则表达式的用法,不做过多阐述,主要看正则在Mysql中的应用。此Blog里的例子都会用下面store数据表:# id, product, price, grade, pro_date, note'1...原创 2020-04-09 16:28:21 · 254 阅读 · 0 评论 -
利用python爬虫(part3)--正则表达式
学习笔记文章目录正则表达式re模块的使用正则表达式元字符贪婪匹配和非贪婪匹配贪婪模式非贪婪模式正则表达式分组正则表达式re模块的使用re模块在爬虫中常用的方法:re.findall() re.compile() pattern.finall()匹配方式1(re.findall)list01=re.findall('正则表达式',html,re.S)#html就是我们获取的...原创 2020-04-03 13:12:14 · 413 阅读 · 0 评论 -
python与正则表达式(part8)--compile对象及match对象的属性方法
compile对象属性(compile函数生成的正则表达式对象的属性)属性含义flagsflags值pattern表示对象的正则表达式groups表示正则表达式中有几个子组groupindex返回:字典{组名:组序列号}举个例子代码和结果放在一起(我太懒了,不想像前几个blog一样,代码结果分开放):十进制32–>二进制10000。...原创 2020-03-09 17:39:12 · 451 阅读 · 0 评论 -
python与正则表达式(part7)--re模块使用
re模块使用finditerre.finditer(pattern,string,flags = 0) 功能: 根据正则表达式匹配目标字符串内容 参数: pattern 正则表达式 string 目标字符串 flags 功能标志位,扩展正则表达式的匹配 返回值: 匹配结果的迭代器,注意是迭代器,不是被迭代对象!举个例子代码1:输出结果1:由以上结...原创 2020-03-09 17:22:18 · 212 阅读 · 0 评论 -
python与正则表达式(part6)--re模块使用
re模块使用splitre.split(pattern,string,flags = 0)功能: 使用正则表达式匹配内容,切割目标字符串参数: pattern 正则表达式 string 目标字符串 flags 功能标志位,扩展正则表达式的匹配返回值: 切割后的内容列表举个例子代码1:输出结果1:subre.sub(pattern,replace,s...原创 2020-03-09 17:06:42 · 222 阅读 · 0 评论 -
python与正则表达式(part5)--re模块使用
re模块使用compileregex = compile(pattern,flags = 0) 功能: 生成正则表达式对象 参数: pattern 正则表达式 flags 功能标志位,用于扩展正则表达式的匹配(默认值0表示没有任何扩展) 返回值: 正则表达式对象备注:扩展是啥呢?比如说,我们有正则表达式【a】,则只能匹配【a】。但如果我们进行了扩展,则我们不仅可以匹配...原创 2020-03-09 16:52:02 · 279 阅读 · 0 评论 -
python与正则表达式(part4)--正则表达式分组
正则表达式分组定义在正则表达式中,以()建立正则表达式的内部分组,子组是正则表达式的一部分,可以作为内部整体操作对象。备注:当我们的正则表达式中存在子组时,就不能用findall(),则要用search().作用①可以被作为整体操作,改变元字符的操作对象例子1(改变 +号 重复的对象)In : re.search(r'(ab)+',"ababababab").group()Out:...原创 2020-03-09 16:24:46 · 338 阅读 · 0 评论 -
python与正则表达式(part3)--贪婪模式和非贪婪模式
贪婪模式和非贪婪模式定义贪婪模式: 默认情况下,匹配重复的元字符总是尽可能多的向后匹配内容。非贪婪模式(懒惰模式): 让匹配重复的元字符尽可能少的向后匹配内容。贪婪模式转换为非贪婪模式在匹配重复元字符后加 ?号即可:贪婪非贪婪**?++????{m,n}{m,n}?例子1(贪婪模式)In: re.findall(r'ab?', "a...原创 2020-03-09 16:08:03 · 440 阅读 · 0 评论 -
python与正则表达式(part2)--正则表达式的转义
正则表达式的转义如果使用正则表达式来匹配特殊字符(. * + ? ^ $ [] () {} | ),则需要在特殊符号前加上【\】 表示转义。例子1In : re.findall('-?\d+\.?\d*',"123,-123,1.23,-1.23")Out: ['123', '-123', '1.23', '-1.23']例子2In :print(re.findall('\$\d...原创 2020-03-09 14:41:27 · 1032 阅读 · 0 评论 -
python与正则表达式(part1)--元字符
元字符使用备注:个别编程语言对元字符的支持略有不同,比如某些元字符在个别编程语言中可能不支持。普通字符匹配规则:每个普通字符匹配其对应的字符例子1In : re.findall('ab',"abcdefabcd")Out: ['ab', 'ab']注意!正则表达式在python中也可以匹配中文例子2(支持UTF-8编码格式的匹配)In :re.findall('小黄', "小黄...原创 2020-03-09 14:09:33 · 389 阅读 · 0 评论 -
正则表达式入门之重复匹配
正则表达式-重复匹配1.重复匹配1.1匹配一个或多个字符要想匹配同一个字符(或字符集合)的多次重复,只要简单地给这个字符(或字符集合)加上一个+字符作为后缀就行了。+匹配一个或多个字符(至少一个:不匹配0个字符的情况)。例1比如我想匹配文本里所有的邮箱#文本#文本Send e-mail to Tom and Ada, their mailbox is 194478原创 2017-08-16 08:12:32 · 5805 阅读 · 0 评论 -
正则表达式入门之使用元字符
正则表达式—使用元字符1. 使用元字符1.1对特殊字符转义在元字符前加上反斜杠就可以对其进行转义:转义序列\.将匹配.本身,转义序列\[将匹配[本身。每个元字符都可以通过给他加上一个反斜杠前缀的方法来转义,如此得到的转义序列将匹配那个字符本身而不是它特殊的元字符含义。例1#文本var myAarray = new Array();...if (myArray[0]原创 2017-08-15 11:29:22 · 446 阅读 · 0 评论 -
正则表达式入门之字符匹配
正则表达式入门-字符匹配在前段时间进行文本挖掘练习的时候,不会使用正则表达式,深感不宜。所以这里,我想赶紧学习一下正则表达式。注:本文是对《正则表达式必知必会》的复习。1.正则表达式简介正则表达式是一些用来匹配和处理文本的字符串,正则表达式语言用来构造正则表达式(最终构造出的字符串就成为正则表达式).正则表达式语言并不是一种完备的程序设计语言,它甚至算不上是一种能够直接安装原创 2017-08-14 21:31:04 · 546 阅读 · 0 评论 -
正则表达式入门之位置匹配
正则表达式-位置匹配位置匹配用来解决在什么地方进行字符串匹配操作的问题。1单词边界例1要求匹配文本里的cat单词#文本The cat scattered his food all over the room.#正则表达式cat#结果The cat scatteredhis food all over the room.从结果来看,不仅是单词cat,单词s原创 2017-08-16 09:35:52 · 1421 阅读 · 0 评论