python爬虫——正则表达式

                                                                                                      python爬虫---正则表达式


#正则表达式实现字符串的提取处理等等操作
#正则不是python独有的,只是python使用re模块进行了支持
 
#常见的匹配模式参加开发文档
#re.match,从头开始匹配,中间匹配不到
import re
str='wqgeygewgfywgqfhdsakdgsafgdsah'
result=re.match("wq",str)
print(result)
 
#.*可以匹配所有的字符
result=re.match("wq.*h",str)
print(result)
 
#使用小括号,可以仅仅匹配小括号里的内容
result=re.match("wq(.*)f",str)
print(result)
print(result.group(1))#group指的是第几个括号里的字符串
 
#贪婪模式.*尽可能多的匹配
#懒惰模式.*?尽可能短的匹配
result=re.match("wq(.*?)f",str)
print(result)
print(result.group(1))#贪婪模式比较常用,因为比较精准
 
#匹配模式,使之可以匹配到换行符
str='wqgeygewgfywgqfhds\
akdgsafgdsah'
result=re.match("wq.*h",str,re.S)
print(result)
 
#转义遇到像$这样的有意义的字符,可以在特殊字符前加\进行转义,即可以匹配
#re.search扫描整个字符串,返回第一个匹配成功的结果
str='wqgeygewgfywgqfhdsakdgsafgdsah'
result=re.match("wg",str)
result_search=re.search("wg",str)
print(result)
print(result_search)
 
#re.findall以列表的形式返回全部的匹配字符串
#re.sub(规则,替换内容,替换的字符串)替换字符串中每一个匹配的子串返回替换后的字符串
#re.compile将正则表达式编译成正则对象
str=""
pattern=re.compile("",re.S)
result=re.match(pattern,str)
#用于代码复用

python全套学习资料,直播教程链接,看主页简介领取,或加q裙 467624262 探讨交流

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值