第一章 数据提取与清洗策略
正则表达式
2.案例:定义密码的正则表达式
re模块使用案例
1.提取
import re
ret = re.findall(【正则表达式】,【被提取的字符串】)
注:
匹配成功返回列表
匹配不成功返回空列表
2.匹配
import re
ret = re.match(【正则表达式】,【被提取的字符串】)
注:
匹配成功返回对象
匹配不成功返回None
3.替换
import re
ret = re.sub(【正则表达式】,【替换成的字符串】,【被匹配的字符串】)
注:
匹配成功返回对象
匹配不成功返回None
4.演示
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
<footer>
<div>
<div class="email">
Email:kefu@CSDN.net
</div>
<div class="tel">
手机号:400-660-0108
</div>
</div>
</footer>
</body>
</html>