005Python-信息标记与提取方法

一、 信息标记的三种形式:

  1. XML

<img src = “china.jpg” size = ‘10’/>
空元素的缩写形式  <name/>
<!- -This is a comment, very useful -->

  1. JSON

有类型的键值对 key:value,key需要加""
当value有多组的时候,用[,]组织
键值对嵌套用{ , }
无类型的键值对key:value,key只能是字符串,不需要加" "

  1. YAML

缩进表达所属关系

name:
	newName:北京理工大学
	oldName:延安自然科学院

表达并列关系:

name:
北京理工大学
延安自然科学院

|表达整块数据 ,#表示数据

二、三种信息标记形式的比较

形式特点作用
XML最早的通用信息标记语言,可扩展性好,但繁琐Internet上的信息交互与传递
JSON信息由类型,适合程序处理(js),较XML简洁移动应用云端和节点的信息通信,无注释
YAML信息无类型,文本信息比例最高,可读性好各类系统的配置文件,有注释易读

三、扩展方法

方法说明
<>.find()搜素且只返回一个结果,同.find_all()参数
<>.find_parents()在先辈节点中搜素,返回列表类型,同.find_all()参数
<>.find_parent()在先辈节点中返回一个结果,同.find()参数
<>.find_next_siblings()在后续平行节点中搜素,返回列表类型,同.find_all()参数
<>.find_next_sibling()在后续平行节点中返回一个结果,同.find_all()参数
<>.find_previous_siblings()在前序平行节点中搜素,返回列表类型,同.find_all()参数
<>.find_previous_siblings()在前序平行节点中返回一个结果,同.find()参数
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值