![797a55ffcdd5b161cebbeef303ebde82.png](https://i-blog.csdnimg.cn/blog_migrate/af03c16938d75a3acb4cf7477d1349a5.png)
在入行之前,需要介绍一些行外人不甚清楚的行内常识。
- 标记后的信息可形成信息组织结构,增加了信息维度
- 标记的信息与信息一样具有同等的重要价值
- 标记后的信息更适合通信、存储和展示
- 标记后的信息更利于程序的理解和运用
比如HTML语言,就是通过预定义的<>...</>结构组织不同类型的信息。其是World Wide Web的信息组织方式,也就是说整个万维网上的信息都是由它组织的。
而信息标记则主要有3中形式
- XML形式:eXtensible Markup Language
- JSON形式:JavaScript Object Notation
- YAML形式:YAML Ain't Markup Language
HTML语言即采用的XML形式,我之前在BeautifulSoup库中已经展示过不少,大致用下面这三行可以解释其标记方法:
<tag class="123">abc</tag>
<tag class="ABCD"/>
<!--A comment-->
JSON形式用下面这三行解释,需要注意的是,其键值对是有类型的