python的括号嵌套字符串匹配问题
首先,先简述一下我遇到的问题:
- 在做新闻页面爬虫时,所获得数据是如下的一串字符,其json字符串位于artiList()当中,所以我的目的表是将json数据通过
python的正则表达式提取出来
artiList({“BD29LPUBwangning”:[{“liveInfo”:null,“docid”:“E9RB5B5V0001875N”,“source”:“中国新闻网”,“title”:“钟山:民营企业已经成为中国对外>贸易的主力军”,“priority”:60,“hasImg”:1,“url”:“http:/3g.163.com/news/19/0309/15/E9RB5B5V0001875N.html”,“commentCount”:0,“imgsrc3gtype”:“1”,“stitle”:"",“digest”:“中新社北京3月9日电中国商务部部长钟山9日在北京表示,今年将”,“imgsrc”:“http:/cms-bucket.ws.126.net/2019/03/09/2adcf4582d8d4f0b8d0da5c781b49cb0.png”,“ptime”:“2019-03-09 15:48:12”}]})
首先,我直接使用
re.findall(r'[(](.*?)[)]', string