操作python中的正则表达式（上）

最新推荐文章于 2023-06-14 14:20:11 发布

beyond_LH

最新推荐文章于 2023-06-14 14:20:11 发布

阅读量1.6k

点赞数 1

分类专栏： Python爬虫文章标签：正则表达式 re match search sub

本文链接：https://blog.csdn.net/beyond9305/article/details/80754112

版权

Python爬虫专栏收录该内容

16 篇文章 145 订阅 ¥9.90 ¥99.00

订阅专栏

本文是Python正则表达式的初步介绍，主要涵盖re模块的基础使用，包括匹配函数match()和search()的基本操作，以及字符串替换功能的sub()函数。通过实例解析，帮助读者理解正则在Python中的应用。

摘要由CSDN通过智能技术生成

上次的爬虫最终获取了马蜂窝旅行评论页面的全部内容，其实很多都是无用信息，我们要进行筛选清洗，这就用到了正则表达式，在写爬虫后续之前先大概搞一下正则……

先上代码吧，今天先搞一小部分：

import re

print(re.match('you','you are my sunshine'))
print(re.match('you','you are my sunshine').span())
print(re.match('my','you are my sunshine'))
print(re.search('you','you are my sunshine').span())
print(re.search('my','you are my sunshine').span())

love='you are my sunshine'
pat=re.match(r'(.*) are (.*?) .*',love)
if pat:
    print('获取的全部字符序列为：'+str(pat.group()))
    print('获取的第一个分组为：'+str(pat.group(1)))
    print('获取的

了解本专栏