python从字符串中提取数据（正则方式）

最新推荐文章于 2024-07-26 10:03:07 发布

米雪唲2

最新推荐文章于 2024-07-26 10:03:07 发布

阅读量2.2k

点赞数

分类专栏： python

@Michelle

本文链接：https://blog.csdn.net/u014150715/article/details/109314743

版权

python 专栏收录该内容

21 篇文章 2 订阅

订阅专栏

1.正则

## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配一个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意非数字字符。
## x? 匹配一个可选的 x 字符 (换言之，它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符，至少 n 次，至多 m 次。
## (a|b|c) 要么匹配 a，要么匹配 b，要么匹配 c。
## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。
## 正则表达式中的点号通常意味着 “匹配任意单字符”

# 由于字符串过长，在编译器中会要求换行，字符“\”为换行后自动添加的，不影响字符串本身
data = "@ijiami_data_boundary" \
     "@ijiami_time:1604045514520" \
     "@ijiami_ip:39.103.130.125:443" \
     "@ijiami_data_boundary" \
     "@ijiami_time:1604045379097" \
     "@ijiami_ip:203.119.211.237:80" \
     "@ijiami_data_boundary" \
     "@ijiami_time:1604045379195" \
     "@ijiami_ip:218.92.133.167:443" \
       "@ijiami_data_boundary" \
     "@request_type:2" \
     "@host_name:toblog.ctobsnssdk.com" \
     "@request_type:2" \
     "@host_name:events.jianshu.io" \
     "Host: alog.umeng.com"

需求场景：提取字符串中的ip

 n = re.findall(r"@ijiami_ip(.+?)@ijiami_data_boundary", data)
 print(n)
 # 结果：
 [':39.103.130.125:443', ':203.119.211.237:80', ':218.92.133.167:443']