Python学习第四周总结

学习Python第四周总结

正则表达式

Python使用正则表达式的两种方式:
不创建正则表达式对象,直接调用函数进行匹配操作
  • match
  • fullmatch

~创建正则表达式对象(Pattern),通过给对象发消息实现匹配操作

  • compile

例子: 网站注册,用户名要求必须是字母、数字、下划线,长度在6-20个字符之间,检查用户名是否合法,应该怎么做?

import re


username = input('请输入用户名: ')
username_pattern = re.compile(r'^\w{6,20}$')
print(type(username_pattern))
matcher = username_pattern.match(username)
print(type(matcher))
if matcher is None:
    print('无效的用户名!!!')
else:
    print(matcher.group())
# matcher = re.match(r'\w{6,20}$', username)
# if matcher is None:
#     print('用户名不合法!!!')
# else:
#     print(matcher)
#     print(matcher.group())


# qq = input('请输入QQ号: ')
# matcher = re.fullmatch(r'[1-9]\d{4,10}', qq)
# if matcher is None:
#     print('QQ号错误!!!')
# else:
#     print(matcher)
#     print(matcher.group())
import re
content = """报警电话: 110, 我们班是Python-2105班,
我的QQ是123456, 我的手机号是15581572054,谢谢!"""
# matcher = re.search(r'1[3-9]\d{9}', content)
# if not matcher:
#     print('没有找到手机号')
# else:
#     print(matcher.group())

pattern = re.compile(r'\d+')
matcher = pattern.search(content)
while matcher:
    print(matcher.group())
    print(matcher.start(), matcher.end())
    matcher = pattern.search(content, matcher.end())

results = pattern.findall(content)
for result in results:
    print(result)

results = re.findall(r'\d+', content)
for result in results:
    print(result)
    

这是我们对正则表达式中的一些基本符号进行的扼要总结。

符号解释示例说明
.匹配任意字符b.t可以匹配bat / but / b#t / b1t等
\w匹配字母/数字/下划线b\wt可以匹配bat / b1t / b_t等
但不能匹配b#t
\s匹配空白字符(包括\r、\n、\t等)love\syou可以匹配love you
\d匹配数字\d\d可以匹配01 / 23 / 99等
\b匹配单词的边界\bThe\b
^匹配字符串的开始^The可以匹配The开头的字符串
$匹配字符串的结束.exe$可以匹配.exe结尾的字符串
\W匹配非字母/数字/下划线b\Wt可以匹配b#t / b@t等
但不能匹配but / b1t / b_t等
\S匹配非空白字符love\Syou可以匹配love#you等
但不能匹配love you
\D匹配非数字\d\D可以匹配9a / 3# / 0F等
\B匹配非单词边界\Bio\B
[]匹配来自字符集的任意单一字符[aeiou]可以匹配任一元音字母字符
[^]匹配不在字符集中的任意单一字符[^aeiou]可以匹配任一非元音字母字符
*匹配0次或多次\w*
+匹配1次或多次\w+
?匹配0次或1次\w?
{N}匹配N次\w{3}
{M,}匹配至少M次\w{3,}
{M,N}匹配至少M次至多N次\w{3,6}
|分支foo|bar可以匹配foo或者bar
(?#)注释
(exp)匹配exp并捕获到自动命名的组中
(?<name>exp)匹配exp并捕获到名为name的组中
(?:exp)匹配exp但是不捕获匹配的文本
(?=exp)匹配exp前面的位置\b\w+(?=ing)可以匹配I’m dancing中的danc
(?<=exp)匹配exp后面的位置(?<=\bdanc)\w+\b可以匹配I love dancing and reading中的第一个ing
(?!exp)匹配后面不是exp的位置
(?<!exp)匹配前面不是exp的位置
*?重复任意次,但尽可能少重复a.*b
a.*?b
将正则表达式应用于aabab,前者会匹配整个字符串aabab,后者会匹配aab和ab两个字符串
+?重复1次或多次,但尽可能少重复
??重复0次或1次,但尽可能少重复
{M,N}?重复M到N次,但尽可能少重复
{M,}?重复M次以上,但尽可能少重复
import re
import requests

# 匹配整个a标签,但是只捕获()中的内容--->正则表达式的捕获组
pattern = re.compile(r'<a\s.*?href="(.+?)".*?title="(.+?)".*?>')
resp = requests.get('https://www.sohu.com/')
results = pattern.findall(resp.text)
for href, title in results:
    print(title)
    if not href.startswith('https://www.sohu.com'):
        href = 'https://www.sohu.com' + href
    print(href)

正则表达式捕获组

从网页上获取新闻的标题和链接

import re
import requests

# 匹配整个a标签,但是只捕获()中的内容--->正则表达式的捕获组
pattern = re.compile(r'<a\s.*?href="(.+?)".*?title="(.+?)".*?>')
resp = requests.get('https://www.sohu.com/')
results = pattern.findall(resp.text)
for href, title in results:
    print(title)
    if not href.startswith('https://www.sohu.com'):
        href = 'https://www.sohu.com' + href
    print(href)

Python对正则表达式的支持

Python提供了re模块来支持正则表达式相关操作,下面是re模块中的核心函数。

函数说明
compile(pattern, flags=0)编译正则表达式返回正则表达式对象
match(pattern, string, flags=0)用正则表达式匹配字符串 成功返回匹配对象 否则返回None
search(pattern, string, flags=0)搜索字符串中第一次出现正则表达式的模式 成功返回匹配对象 否则返回None
split(pattern, string, maxsplit=0, flags=0)用正则表达式指定的模式分隔符拆分字符串 返回列表
sub(pattern, repl, string, count=0, flags=0)用指定的字符串替换原字符串中与正则表达式匹配的模式 可以用count指定替换的次数
fullmatch(pattern, string, flags=0)match函数的完全匹配(从字符串开头到结尾)版本
findall(pattern, string, flags=0)查找字符串所有与正则表达式匹配的模式 返回字符串的列表
finditer(pattern, string, flags=0)查找字符串所有与正则表达式匹配的模式 返回一个迭代器
purge()清除隐式编译的正则表达式的缓存
re.I / re.IGNORECASE忽略大小写匹配标记
re.M / re.MULTILINE多行匹配标记

不良内容过滤

import re

content = '马化腾是一个沙雕煞笔,FUck you!'
pattern = re.compile(r'[傻沙煞][逼笔雕鄙]|马化腾|fuck|shit', flags=re.IGNORECASE)
# modified_content = re.sub(r'[傻沙煞][逼笔雕鄙]|马化腾|fuck|shit', '*', content, flags=re.I)
modified_content = pattern.sub('*', content)
print(modified_content)

IGNORECASE)

modified_content = re.sub(r’[傻沙煞][逼笔雕鄙]|马化腾|fuck|shit’, ‘*’, content, flags=re.I)

modified_content = pattern.sub(’*’, content)
print(modified_content)

  • 8
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《Python学习手册》第四版和第五版都是Python学习的优秀教材。这两版书籍都由Mark Lutz 编写,是Python编程领域权威性的参考书。下面我将分别介绍这两个版本的特点。 《Python学习手册》第四版于2009年出版,是一本深入研究Python的经典教材。该版书从基础的Python语法和语义开始,逐渐深入讲述了函数、模块、面向对象编程、数据结构等内容。书中示例丰富,解释详细,配有大量的代码演示,让读者能够更好地理解和掌握Python知识。此外,该版书还介绍了Python的标准库以及一些流行的第三方库,如Numpy、Matplotlib等,帮助读者扩展应用Python的能力。 《Python学习手册》第五版于2013年出版,是第四版的升级版。这个版本在基本框架上延续了一版的内容,同时也进行了相应的更新和改进。该版书对一些重要的新特性进行了介绍,如Python 3的一些语法差异和变化。此外,该版书还增加了新的章节,介绍了一些新的主题和技术,如迭代器、生成器、装饰器等。此外,该版本还增加了对Python与网络、数据库等的应用实例,帮助读者更好地理解和运用Python。 总体而言,第四版和第五版均是优秀的Python学习教材。第四版是经典的入门教程,适合初学者学习Python的基础知识和编程技巧;第五版则在第四版的基础上进行了升级和扩展,更加全面地介绍了Python的一些新特性和高级技术。无论选择哪个版本,读者都能够获得全面而深入的Python学习经验。 ### 回答2: 《Python学习手册》第四版和第五版是两本关于Python编程语言的教程书籍。这两本书都是由Mark Lutz撰写,并且都是颇有实力和广泛认可的Python教材。 第四版是在2011年出版的,是一本全面介绍Python编程的书籍。它从Python的基本语法和数据结构开始,逐渐引导读者学习高级主题,如面向对象编程、GUI编程、网络编程等。该书还包含了大量实例和演示,帮助读者更好地理解Python的概念和用法。第四版对Python的各个方面有着详尽的介绍,适合初学者和有一定经验的Python开发者使用。 第五版是在2019年出版的,是《Python学习手册》系列的最新版。相比第四版,第五版对Python编程进行了更新和补充。该书新增了对Python 3.x版本的支持,并提供了更多关于新特性和改进的内容。此外,第五版还引入了一些新的主题,如异步编程和数据科学等,以适应当Python发展的需求。第五版的内容更加丰富和全面,可以帮助读者更好地掌握Python的各个方面。 总而言之,无论是第四版还是第五版,《Python学习手册》都是优秀的Python编程学习资料。初学者可以通过这两本书系统地学习Python的基础知识和高级特性,而有经验的开发者也可以通过这些书籍深入了解Python的内部机制和一些高级技术。无论是用作学习指南还是作为工具手册,《Python学习手册》都是学习和掌握Python编程的不可或缺的资源。 ### 回答3: 《Python学习手册》第四版和第五版都是关于Python编程语言的教程书籍,适合想要学习Python的初学者和有一定编程经验的用户。这两个版本都有各自的特点和优势。 第四版是《Python学习手册》系列的经典之作,经过多年的沉淀和实践,被广大Python爱好者所熟知和推崇。它以通俗易懂的方式介绍了Python语言的基础知识和核心概念,包括语法、函数、模块、面向对象编程等内容。此外,第四版还涵盖了一些高级主题,如网络编程、GUI编程和数据库编程等,能够帮助读者全面掌握Python的应用领域。 而《Python学习手册》第五版则基于Python3,将其最新的特性和改进纳入了教程中。第五版相对于第四版来说,更新了一些旧有内容和示例,并增加了一些新的章节。同时,第五版在教学方式上更加强调实例和项目的实践,通过实际操作来让读者更好地理解和掌握Python编程。此外,第五版还介绍了一些Python在数据科学和机器学习等领域的应用,可以帮助读者进一步拓展Python的使用范围。 总的来说,第四版和第五版的《Python学习手册》是学习Python编程的优秀教程。第四版适合初学者入门,内容较为全面,而第五版则更加注重实践和最新特性的介绍,对有一定Python基础的读者来说更具可取性。无论选择哪个版本,都能够提供很好的学习指导和实践经验,帮助读者成为Python编程的专家。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值