☞ ░ 老猿Python博文目录:https://blog.csdn.net/LaoYuanPython/article/details/98245036 ░
一、引言
最近看到好几篇类似“n行Python代码…”的博文,看起来还挺不错,简洁、实用,传播了知识、带来了阅读量,撩动了老猿的心,决定跟风一把,推一个“n行Python代码系列”文章。
今天介绍使用2行代码将JSON文本转换成Python字典类型的简单快速方法。后续更多“n行Python代码系列”文章请参考免费专栏《https://blog.csdn.net/laoyuanpython/category_10858655.html n行Python代码系列》。
二、背景
老猿在通过程序获取CSDN博文的评论区信息时,发现其返回信息是一个复杂的JSON格式文本,内容示例如下:
{"code":200,"message":"success","data":
{"count":47,"pageCount":3,"floorCount":27,"list":
[
{"info":
{"commentId":15302301,"articleId":113663811,"parentId":0,"postTime":"2021-03-07 19:21:17","content":"恭喜你","userName":"ria4com","digg":0,"diggArr":[],"parentUserName":null,"parentNickName":null,"avatar":"https://profile.csdnimg.cn/B/2/3/3_ria4com","nickName":"低代码游戏开发","dateFormat":"1 小时前","tag":"","parentTag":null,"years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null},
"sub":[],
"pointCommentId":null
},
{
"info":
{"commentId":14922981,"articleId":113663811,"parentId":0,"postTime":"2021-02-05 15:06:21","content":"大佬无敌强","userName":"weixin_44671737","digg":0,"diggArr":[],"parentUserName":null,"parentNickName":null,"avatar":"https://profile.csdnimg.cn/E/3/5/3_weixin_44671737","nickName":"兴趣使然的程序猿","dateFormat":"1 月前","tag":"爱码士","parentTag":null,"years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null},
"sub":
[{"commentId":14923083,"articleId":113663811,"parentId":14922981,"postTime":"2021-02-05 15:13:57","content":"感谢支持!一起加油!","userName":"LaoYuanPython","digg":0,"diggArr":[],"parentUserName":"weixin_44671737","parentNickName":"兴趣使然的程序猿","avatar":"https://profile.csdnimg.cn/0/8/1/3_laoyuanpython","nickName":"LaoYuanPython","dateFormat":"1 月前","tag":"爱码士","parentTag":"爱码士","years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null}],
"pointCommentId":null
}
]
}
}
可以看到这个数据是比较复杂的,但整体就是一个符合JSON格式要求的文本,相对一个评论来说,管理的数据冗余太多,有些数据老猿也没弄明白含义,只关注了响应码code、响应消息message、评论条数count、评论时间postTime、评论内容content、评论发表者userName、评论者昵称nickName等信息。
针对该响应码需要进行数据分析时,如果将其转换成标准字典类型,则数据访问代码好实现,于是利用了Python的内置JSON模块将上述文本转换成了字典类型,再进行数据解析,发现真的好用。
三、Python JSON模块简介
3.1、概述
JSON模块是Python内置模块,无需单独安装,直接import就可以使用,主要用来进行Python对象的序列化和反序列化。该模块中常用的方法有以下四个:
- json.dump
将Python对象序列化为Json格式的数据流并写入文件类型的对象中
- json.dumps
将Python对象序列化为Json格式的字符串
- json.load
从文件类型的对象中读取Json格式的数据并反序列化成Python对象
- json.loads
将包含Json格式数据的字符串反序列化成Python对象
3.2、loads函数介绍
本文主要用到JSON模块的loads函数,用于将字符文本转换为Python内置的标准类型。
调用语法
loads(s, *, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
参数介绍
- s:JSON格式的输入字符,可以是 str、bytes 、 bytearray类型
-
*
:命名关键字参数分隔符,关于命名关键字参数请参考《https://blog.csdn.net/LaoYuanPython/article/details/94406075Python中sorted(iterable, *, key=None, reverse=False)函数参数定义中的独立星号(*)的含义
》的介绍 - cls:指定一个定制的JsonDecoder子类,以便实现特定的反序列化需求,一般情况下无需关注,缺省使用JSONDecoder类来解码
- object_hook:一个可选参数,对应一个函数,用于处理解码后生成的Python对象中dict类型的值,其返回值将代替字典类型,该参数能用于实现定制的解码器,一般无需单独关注
- parse_float:可选参数,将用于处理每个JSON float类型的字符串解码。没有指定时缺省使用float(num_str)来解码浮点数字符串
- parse_int:可选参数,将用于处理每个JSON int类型的字符串解码。没有指定时缺省使用int(num_str)来解码浮点数字符串
- parse_constant:可选参数,如果指定,将出现Infinity、Infinity、NaN三个字符串之一时调用
- object_pairs_hook:可选参数,如果指定该参数并且设置为一个可调用对象,object_pairs_hook函数的返回值替换dict类型,当同时指定该参数和object_hook参数时,object_pairs_hook优先
- kw:传递一些其他关键字参数,当encoding在kw中出现时,Python3.1之后的版本将忽略encoding参数
四、使用JSON反序列化识别JSON文本代码示例
>>> import json
>>> text = """{"code":200,"message":"success","data":
{"count":47,"pageCount":3,"floorCount":27,"list":
[
{"info":
{"commentId":15302301,"articleId":113663811,"parentId":0,"postTime":"2021-03-07 19:21:17","content":"恭喜你","userName":"ria4com","digg":0,"diggArr":[],"parentUserName":null,"parentNickName":null,"avatar":"https://profile.csdnimg.cn/B/2/3/3_ria4com","nickName":"低代码游戏开发","dateFormat":"1 小时前","tag":"","parentTag":null,"years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null},
"sub":[],
"pointCommentId":null
},
{
"info":
{"commentId":14922981,"articleId":113663811,"parentId":0,"postTime":"2021-02-05 15:06:21","content":"大佬无敌强","userName":"weixin_44671737","digg":0,"diggArr":[],"parentUserName":null,"parentNickName":null,"avatar":"https://profile.csdnimg.cn/E/3/5/3_weixin_44671737","nickName":"兴趣使然的程序猿","dateFormat":"1 月前","tag":"爱码士","parentTag":null,"years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null},
"sub":
[{"commentId":14923083,"articleId":113663811,"parentId":14922981,"postTime":"2021-02-05 15:13:57","content":"感谢支持!一起加油!","userName":"LaoYuanPython","digg":0,"diggArr":[],"parentUserName":"weixin_44671737","parentNickName":"兴趣使然的程序猿","avatar":"https://profile.csdnimg.cn/0/8/1/3_laoyuanpython","nickName":"LaoYuanPython","dateFormat":"1 月前","tag":"爱码士","parentTag":"爱码士","years":null,"vip":null,"vipIcon":null,"companyBlog":null,"companyBlogIcon":null,"flag":null,"flagIcon":null,"levelIcon":null}],
"pointCommentId":null
}
]
}
}"""
>>> response = json.loads(text)
>>> print(response['code'],response['data']['count'],response['data']['list'][0]['info']['nickName'],response['data']['list'][0]['info']['content'])
200 47 低代码游戏开发 恭喜你
>>>
可以看到,上面案例中,将JSON文本转换成Python字典对象只需要import函数loads,再使用loads执行反序列化即可,用2行代码完成了JSON文本到字典类型的转换。
五、小结
本文介绍了使用Python内置模块JSON将JSON格式文本转换成Python标准字典类型的方法和案例,通过JSON模块的loads即可简单快速完成JSON文本的处理,生成标准的Python对象,方便后续程序的访问。
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
如果对文章内容存在疑问,可以在博客评论区留言,或关注:老猿Python 微信公号发消息咨询。
更多Python爬虫入门的介绍请参考专栏《Python爬虫入门 》
专栏网址:https://blog.csdn.net/laoyuanpython/category_10762553.html
关于老猿的付费专栏
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。
前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。
对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。
如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。