python的括号嵌套字符串匹配问题
首先,先简述一下我遇到的问题:
- 在做新闻页面爬虫时,所获得数据是如下的一串字符,其json字符串位于artiList()当中,所以我的目的表是将json数据通过
python的正则表达式提取出来
artiList({“BD29LPUBwangning”:[{“liveInfo”:null,“docid”:“E9RB5B5V0001875N”,“source”:“中国新闻网”,“title”:“钟山:民营企业已经成为中国对外>贸易的主力军”,“priority”:60,“hasImg”:1,“url”:“http:/3g.163.com/news/19/0309/15/E9RB5B5V0001875N.html”,“commentCount”:0,“imgsrc3gtype”:“1”,“stitle”:"",“digest”:“中新社北京3月9日电中国商务部部长钟山9日在北京表示,今年将”,“imgsrc”:“http:/cms-bucket.ws.126.net/2019/03/09/2adcf4582d8d4f0b8d0da5c781b49cb0.png”,“ptime”:“2019-03-09 15:48:12”}]})
首先,我直接使用
re.findall(r'[(](.*?)[)]', string
本文讨论了在Python中处理包含括号嵌套的字符串时,如何使用正则表达式提取JSON数据。作者遇到的问题是在新闻爬虫中,目标JSON数据位于artiList()内,直接使用正则表达式无法正确匹配括号内的内容。通过改进正则表达式,最终实现了对括号嵌套的匹配。同时推荐了两款正则表达式在线测试和生成工具。
最低0.47元/天 解锁文章

62

被折叠的 条评论
为什么被折叠?



