Python，匹配

最新推荐文章于 2024-06-22 09:36:52 发布

楼台倒影入池塘ii

最新推荐文章于 2024-06-22 09:36:52 发布

阅读量127

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64986686/article/details/123619400

版权

Python BeautifulSoup 网页爬虫正则表达式数据提取

关键词由CSDN通过智能技术生成

from bs4 import BeautifulSoup
from urllib import request

#定义请求
req=request.Request('http://www.baidu.com')
#定义下载器
opener=request.build_opener()
#下载页面
resp=opener.open(req)
print(resp.read().decode('utf-8'))

#定义解析器
soup= BeautifulSoup(resp,'html.parser',from_encoding='utf-8')
#第一步，找到标签
links=soup.find_all('a')
for link in links:
if hasattr(link,"href"):
print(link.name,link.get('hred'), link.get_text())

import re

#定义正则化规则=匹配模式
pattern=re.compile(r'hello')
#匹配文本
result1=re.match(pattern,'hello hello')
print(result1)

pattern2=re.compile(r'a.c')
result2=re.match(pattern2,'abcdefg')
print(result2)

pattern3=re.compile('a\.c')
result3=re.match(pattern3,'a.cdefg')
print(result3)

pattern4=re.compile(r'a[a-h,A-z]bc')
result4=re.match(pattern4,'agbcefg')
print(result4)

pattern5=re.compile(r'a\dbc')
result5=re.match(pattern5,'a9bcdfg')
print(result5)

pattern6=re.compile(r'ab\sc')
result6=re.match(pattern6,'ab cdefg')
print(result6)

pattern7=re.compile(r'aaa\Wbbb')
result7=re.match(pattern7,'aaa@bbb')
print(result7)

#匹配邮箱12345678@qq.com
pattern8=re.compile(r'\d+@\W+\.\w+')
result8=re.search(pattern8,'fhujhfusdasdh123456@qqq.com')
print(result8)

楼台倒影入池塘ii

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python，匹配

from bs4 import BeautifulSoupfrom urllib import request#定义请求req=request.Request('http://www.baidu.com')#定义下载器opener=request.build_opener()#下载页面resp=opener.open(req)print(resp.read().decode('utf-8'))#定义解析器soup= BeautifulSoup(resp,'html.parser',.
复制链接

扫一扫

楼台倒影入池塘ii CSDN认证博客专家 CSDN认证企业博客

码龄3年

20: 原创

77万+: 周排名

114万+: 总排名

1万+: 访问

: 等级

200: 积分

5: 粉丝

0: 获赞

0: 评论

3: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。