信息标记与提取方法(XML、JSON、YAML)

本文详细介绍了信息标记的三种主要语言:XML、JSON和YAML,包括它们的基本概念、语法特点、与HTML的区别、实例演示以及它们在信息传输和存储中的作用。XML作为早期的标准,侧重于数据传输;JSON因其简洁性,常用于移动应用与云端通信;YAML则以高可读性,适合配置文件。信息提取方法包括完整解析和直接搜索,各有优缺点,实践中可结合使用。
摘要由CSDN通过智能技术生成

信息标记

        实际应用中的原始数据往往是杂乱无章的,为了更加方便组织和存储各种信息,以及为计算机处理、传播消息提供一种统一的方法。必须对信息进行一定的标记,信息标记的特点一般有以下几点:

        1、标记后的信息可形成信息组织结构,增加了信息维度

        2、标记的结构与信息一样具有重要价值

        3标记后的信息可用于通信、存储或展示

        4、标记后的信息更利于程序理解和运用

        常用的信息标记主要有XML、JSON、YAML三种,基于WWW(World Wide Web)的信息组织方式是HTML(HyperText Markup Language,超文本标记语言)。



XML(可扩展标记语言)

XML简介

        XMLExtensible Markup Language)即可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。

        在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。

        1998年2月,W3C正式批准了可扩展标记语言的标准定义,可扩展标记语言可以对文档和数据进行结构化处理,从而能够在部门、客户和供应商之间进行交换,实现动态内容生成,企业集成和应用开发。可扩展标记语言可以使我们能够更准确的搜索,更方便的传送软件组件,更好的描述一些事物。例如电子商务交易等。

        XML和HTML都是标准通用标记语言的子集,XML是被设计用来传输和存储数据,而HTML是被设计用来显示数据的。

        XML语言具有如下一些特点:

        1、可扩展标记语言是一种很像超文本标记语言的标记语言。

        2、它的设计宗旨是传输数据,而不是显示数据。

        3它的标签没有被预定义。需要自行定义标签。

        4、它被设计为具有自我描述性。

        5、它是W3C的推荐标准。


XML与HTML的区别

        1XML不是HTML的替代。而是对HTML的补充。

        2、它和HTML为不同的目的而设计:XML被设计用来传输和存储数据,其焦点是数据的内容。HTML被设计用来显示数据,其焦点是数据的外观。

        3、HTML旨在显示信息,而XML旨在传输信息。对XML最好的描述是:它是独立于软件和硬件的信息传输工具。


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值