Python爬虫- 正则表达式

DAY2 - 正则表达式

一、OS

import os

os.mkdir(文件夹路径) - 在指定的位置创建指定文件夹

os.mkdir('files/test')

os.path.exists(文件夹路径/文件路径) - 判断指定文件夹或者文件是否存在

if not os.path.exists('files/test'):
    os.mkdir('files/test')

二、正则

import re
from re import *
1. 正则的作用
  • 正则表达式是一种可以让复杂的字符串变得简单的工具。
  • 写正则表达式就是用正则符号来描述字符串规则
# 案例1:判断一个字符串是否是一个合法的手机号码
tel = '23297293329'

# 方法1:不用正则
if len(tel) == 11:
    if tel[0] == '1':
        if tel[1] in '3456789':
            if tel[2:].isdigit():
                print('合法')
            else:
                print('不合法')
        else:
            print('不合法')
    else:
        print('不合法')
else:
    print('不合法')

print('--------------------------------华丽的分割线-------------------------------------')
result = re.fullmatch(r'1[3-9]\d{9}', tel)
if result:
    print('合法')
else:
    print('不合法')


# 案例2:提取字符串中所有的数字子串,并且求和
str1 = '睡觉89jss=3.45-换手23=抗生素820=8'
result = re.findall(r'\d+\.?\d*', str1)
print(sum([float(x) for x in result]))

三、正则表达式

1.re模块 - 提供了python中所有和正则相关的函数
  • fullmatch(正则表达式,字符串) - 判断整个字符串是否满足正则表达式所描述的规则
  • findall(正则表达式,字符串) - 提取字符串中所有满足正则表达式的子串
  • search(正则表达式,字符串) -匹配字符串中第一个满足正则表达式的字子串

注意:Python中表示一个正则表达式一般使用r字符串

2.正则符号

=第一类符号:匹配类符号

1)普通符号 - 在正则表达式中表示符号本身的符号
result = fullmatch(r'abc','abc')
print(result)
2) . - 匹配任意一个字符
result = fullmatch(r'.bc','*bc')
print(result)


result = fullmatch(
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值