HTML XML JSON
XML是解析HTML的一个中间产物。我们解析HTML时,可以直接对HTML进行解析,也可以先把HTML处理成XML,再对XML解析
树形结构
根节点—父节点 -子节点HTML 标签(HTML tag)
见HTML学习记录破解XML
-
XML的英文是Extensible Markup Language,翻译过来是“可扩展标记语言
-
HTML更加擅长于内容的表示,也就是说HTML可以表现样式丰富的内容
-
XML则更加偏向于数据本身,不关心数据是如何展示的。
破解JSON
JSON是一种数据结构JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,
- 容易的进行阅读和编写
- 同时也方便了机器进行解析和生成。适用于进行数据交互的场景,
- 比如网站前台与后台之间的数据交互。
JSON其实包括两种数据结构,一种是对象,一种是数组。
对象这种结构类似Python的字典
数组这种结构类似Python的列表
Python的库里面有一个JSON模块
import json
Json.loads()
负责把Json格