最近在工作中遇到了嵌套多层的json串,不仅包括类似于python字典的嵌套,里面还有数组的嵌套。
具体的例子如下,在这里列举了三个例子,其实处理了大约500万条,虽然嵌套也挺多,但相对于专业的爬虫工程师来说,这肯定是小意思而已。这个json串的意思是一个企业所对应的规则,前面是企业的id(因为保密,所以企业id肯定更改了),因为本人是在滴滴,所以对应的规则当然是用车规则了,还是因为保密,所以规则的具体内容也不介绍了,只需要知道json串中的一个键值对对应一个规则即可。这里的需求是将所有嵌套去掉,将规则平铺,还要求出规则的数量。
1、"company_id":103619980061540 {"use_car_time":[],"use_car_position":[],"use_car_srv":[{"use_car_type":201,"require_level":[100,400,200]},{"use_car_type":301,"require_level":[600]},{"use_car_type":401,"require_level":[]},{"use_car_type":501,"require_level":[1000]}]}
2、"company_id":82920293004 {"use_car_position":{"cities_on":[{"id":5,"name":"\u676d\u5dde"}],"cities_off":[{