信息标记的三种形式(爬虫基础)

最新推荐文章于 2021-12-21 21:57:06 发布

马马也

最新推荐文章于 2021-12-21 21:57:06 发布

阅读量719

点赞数

分类专栏： other python爬虫学习文章标签： arithmetic

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/machi1/article/details/89742673

版权

other 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

python爬虫学习

7 篇文章 0 订阅

订阅专栏

一. 前言

学习爬虫不仅要学习怎样爬取到一个网页,更要学习如何将爬取到的内容进行解析,没有解析的数据是没有价值的,下面就让我们看一下网页中信息标记的三种形式.

二. 三种形式:

1.XML(可扩展标记语言):

(1)主要通过标签的形式对信息进行标记:

例: <name>内容</name> (中间有内容)

<name/> (中间没内容)

(注释)

2.JSON:

(1)有类型的键值对: "key":"value"

(2)键和值都要加双引号表示字符串类型,数字可以不用加双引号

(3)一个键对应多个值时加中括号:

例: "name":["value1", "value2"]

(4)键值对嵌套用{,}:

例: "name":{

"oldName":"value1",

"newName":"value2"

}

(5)"key":"value"

"key":["value1", "value2"]

"key":{"subkey":"subvalue"}

3.YAML:

(1)无类型键值对 key:value

(2)通过缩进来表达所属关系

例: name:

oldName:北京理工大学

newName:延安自然科学院

(3)-表达并列关系:

例: name:

-北京理工大学

-延安自然科学院

(4)|标达整块数据,#表示注释

例: 个人简介:| #简介

我的名字叫马马也,位于山东省济南市,现在是一名在校大二学生,性别男,爱好女,是一个积极向上,拥护党和国家的三好少年,希望大家多多关注我,

三. 三种信息标记形式的比较:

1.XML:可扩展性好,但繁琐.主要用于在Internet上的信息交互与传递.

2.JSON:信息有类型,适合程序处理(js),较XML简介.主要用于移动应用云端和节点的信息通信,无注释.

3.YAML:信息无类型,文本信息比例最高,可读性好.各类系统的配置文件,有注释易读.

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

马马也 CSDN认证博客专家 CSDN认证企业博客

码龄7年

99: 原创

5万+: 周排名

-: 总排名

19万+: 访问

: 等级

3001: 积分

80: 粉丝

164: 获赞

22: 评论

0: 收藏

私信

关注

热门文章

分类专栏

最新评论

通过jsp实现用户登陆和注销(通过session保存用户信息)
飞驰人生: <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>登陆界面</title> </head> <body> <form method="post" action="login.jsp"> 用户名<input type="text" name="username"><br> 密码<input type="password" name="passward"><br> <input type="submit" value="提交"> </form> <% String s1 = request.getParameter("username"); String s2 = request.getParameter("passward"); if(s1 == null&& s2 == null){ }else if(s1.equals("sdnu")&& s2.equals("1234")){ session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功" + "<br>"); out.println("<a href='welcome.jsp'>" + "点击这里返回主页面" + "</a>"); /* out.println(s1 + " , " + s2); out.println("用户名或密码错误"); */ } else{ //out.println(s1 + " , " + s2); out.println("用户名或密码错误"); /* session.setAttribute("username", s1); session.setAttribute("password", s2); out.println("登陆成功"); */ } %> </body> </html>
Java中使用try语句实现自动关闭输入输出流
yang834774322: 可以多行的，任何实现了java.lang.AutoCloseable、java.io.Closeable接口都可以被当做资源回收。而且里面仅有一条语句的话也不必有分号
数组倒序输出
信点什么好呢: 现在Collections.reverse（list）一行代码就完了
C语言中简单静态链表的建立实例
weixin_57345936: 简单的
C语言中简单静态链表的建立实例
weixin_57345936: 是

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。