【正则表达式】从字符串中提取数字

【Python爬虫原理与实战】 同时被 2 个专栏收录
18 篇文章 0 订阅
  1. 使用正则表达式,用法如下:

    ## 总结
    ## ^ 匹配字符串的开始。
    ## $ 匹配字符串的结尾。
    ## \b 匹配一个单词的边界。
    ## \d 匹配任意数字。
    ## \D 匹配任意非数字字符。
    ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
    ## x* 匹配0次或者多次 x 字符。
    ## x+ 匹配1次或者多次 x 字符。
    ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
    ## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
    ## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。
    ## 正则表达式中的点号通常意味着 “匹配任意单字符”
  2. 解题思路:

    2.1 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数;

    2.2 所以一般是形如:----.-----;

    2.3 根据上述正则表达式的含义,可写出如下的表达式:"\d+\.?\d*";

    2.4 \d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;\.?这个是匹配小数点的,可能有,也可能没有;\d*这个是匹配小数点之后的数字的,所以是0个或者多个;

  3. 代码如下:

    # -*- coding: cp936 -*-
    import re
    
    string="A1.45,b5,6.45,8.82"
    print re.findall(r"\d+\.?\d*",string)
    
    # ['1.45', '5', '6.45', '8.82']
©️2021 CSDN 皮肤主题: Age of Ai 设计师:meimeiellie 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值