作者:ywsydwsbn
字数:9839
日期:2020年8月18日17:26
用python轻轻松松解析XML和PDF
Python 解析 XML
XML的诞生
XML
全称 Extensible Markup Language
,中文译为可扩展标记语言。
XML 之前有两个先行者:SGML
和 HTML
,率先登场的是 SGML, 尽管它功能强大,但文档结构复杂,既不容易学也不易于使用,因此几个主要的浏览器厂商均拒绝支持 SGML,这些因素限制了 SGML 在网上的传播性;
1989 年 HTML 登场,它继承了 SGML 诸多优点,去除了 SGML 复杂庞大的缺点,HTML 在数据显示上表现十分出色,但它的语法是不可扩展的,因此其无法描述数据、可读性差,没办法人们再次将目光转向 SGML,经过对 SGML 一系列改造,终于在 1998 年,XML 第一个版本问世。
简单来说就是:XML 和 HTML 均由 SG