(五)基于bs4库的HTML内容检索
(1)信息的标记
-
标记后的信息可形成信息组织结构,增加了信息维度
-
标记的结构和信息一样具有重要价值
-
标记后的信息可用于通信、存储或展示
-
标记后的信息更利于程序理解和运用
-
例:HTML是WWW(World Wide Web)的信息组织方式
-
HTML通过预定义的<>…</>标签形式组织不同类型的信息
(2)信息标记的三种形式
1.XML
<!-- XML(eXtensible Markup Language) -->
<!-- 标签tag -->
<!-- 名称img 后接属性 -->
<img src="china.jpg" size="10">...</img>
<!-- 空元素的缩写形式 -->
<img src="china.jpg" size="10" />
<name>...</name