贾继康的博客

屌丝蜕变养成记!!!

正则表达式基本规则

正则表达式基本规则

1:正则表达式在实际中的一个经典应用是识别邮箱地址。虽然不同邮箱服务器的邮箱地址的具体规则不尽相同,但是我们还是可以创建几条通用规则。

这里写图片描述

把上面的规则连接起来,就获得了完整的正则表达式。

[A-Za-z0-9\._+]+@[A-Za-z]+\.(com|org|edu|net)

2:正则表达式常用符号
这里写图片描述
3:简单示例
a:注意代码中的正则表达式

# coding=utf-8
"""
@author: jiajiknag
程序功能:获取网页上的图片,且打印出图片的相对路径
        待抓取的网页是 http://www.pythonscraping.com/pages/page3.html
"""
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
# urlopen 用来打开并读取一个从网络获取的远程对象
html = urlopen("http://www.pythonscraping.com/pages/page3.html")
bs0j = BeautifulSoup(html)
images = bs0j.findAll("img",{"src":re.compile("\.\./img\/gifts/img.*\.jpg")})
for image in images:
    print(image["src"])

b:结果
这里写图片描述

4:在线正则表达式
在线检查自己写的正则表达式是否正确:https://www.regexpal.com/

注:
不全面,如有关于正则表达式的会继续更新,博主只是用来作为自己的电子笔记以后方便查阅罢了!!!

阅读更多
文章标签: 正则表达式
个人分类: python
上一篇python之BeautifulSoup库
下一篇python之收集网站数据(三种方式)
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭