python-正则表达式/JsonPath

最新推荐文章于 2024-03-17 10:45:00 发布

weixin_50222618

最新推荐文章于 2024-03-17 10:45:00 发布

阅读量1.4k

点赞数

文章标签： python 开发语言后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50222618/article/details/121572584

版权

一.正则表达式的作用：处理文本提取信息

二.正则表达式怎么写

1.正则表达式验证工具：https://regex101.com

2.正则表达式=普通字符+特殊字符

普通字符：任意字符，直接匹配

特殊字符：有特殊含义

三.常见的的特殊符号

. 匹配除换行符之后的任意单个字符

* 匹配前面子表达式任意次（包括0次）

+匹配前面子表达式任意一次或者多次

{m,n} 匹配m~n次

？尽可能少的去匹配

\ 进行转义如果需要匹配特殊字符，就需要用\进行转义

\d 匹配0-9之间任意字符 [0-9]

\D陪陪不是0-9之间的任意字符 [^0-9]

\s匹配任意一个空白字符包括空格换行符 tab

\S匹配任意一个不是空白字符

\w 匹配任意一个文字字符包括字母数字下划线

\W 匹配任意一个不是文字字符包括字母数字下划线

[] 匹配几个字符之一

^ 表示文本的开头位置，非

$ 文本最后的位置

（） (\d+)我的手机号码(\d+)

content="""

杭州自动化测试 12-15k

西安自动化工程师 10-18K*12薪

"""

方案一：用string的内置函数 split,find,join等

方案二：正则表达式

import re

r=re.complie(r'\d+-\d+K[\*\薪]*')

for one in r.findall(content):

print(one)

contend1="""13211113333我的手机号1111

134我的手机号码444

"""

r1=re.compile(r'(\d+)我的手机号(\d+)')

for two in r1.findall(content1):

print(two)

content2="""秋天；春天夏天，冬天

"""

names=re.split(r'\W+',content2)

print(names)

--------JsonPath-----------

jsonpath作用：对json文本信息进行提取

json?类似字典但不是字典，结构类似字典的字符串

常见特殊符号：

$ 跟节点

.. 选择所有符号条件（模糊匹配）

*匹配所有的元素节点

@ 当前节点

?() 进行数据的过滤

. 取子节点

import jsonpath

d={

"error_code":0,

"stu_info":

[{"name":"zhangsan","sex":"femal",“class";"244"},

{"name":"lisi","sex":"femal",“class";"245"},

]

}

name=d["stu_info"][0]["name"]

print(name)

#模糊匹配

data=jsonpath.jsonpath(d,"$..name")

#精确匹配

data=jsonpath.jsonpath(d,"$.stu_info[0].name")

data=jsonpath.jsonpath(d,"$.stu_info[:2]")

#过滤性别为Femal的信息

data=jsonpath.jsonpath(d,"$.stu_info[?(@.sex=='femal')]")

#过滤包含性别的信息

data=jsonpath.jsonpath(d,"$.stu_info[?(@.sex)]")

"""

jsonpath模块出处理json数据

"""

json_data='{"name":"aa","id":"11"}'

#json数据转化成字典，反序列化

d2=json.loads(json_data)

print(jsaonpath.jsonpath(d2,"$.name")

weixin_50222618

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python-正则表达式/JsonPath

一.正则表达式的作用：处理文本提取信息二.正则表达式怎么写 1.正则表达式验证工具：https://regex101.com 2.正则表达式=普通字符+特殊字符普通字符：任意字符，直接匹配特殊字符：有特殊含义三.常见的的特殊符号 . 匹配除换行符之后的任意单个字符 * 匹配前面子表达式任意次（包括0次） +匹配前面子表达式任意一次或者...
复制链接

扫一扫

weixin_50222618 CSDN认证博客专家 CSDN认证企业博客

码龄4年

24: 原创

59万+: 周排名

146万+: 总排名

3万+: 访问

: 等级

243: 积分

3: 粉丝

1: 获赞

1: 评论

40: 收藏

私信

关注

热门文章

最新评论

python-日志处理
北风之神c: 写得赞，博主用心了。此国产日志 https://github.com/ydf0509/nb_log 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。4、多进程日志切割安全，文件日志写入性能高 5、入参简单，能一键自动记录到多种地方. 相比 loguru 有10胜。 pip install nb_log 。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。