XML文件简介
在计算机领域,XML(extensible markup language)指的是可扩展标记语言,类似于HTML,它设计的宗旨是传输数据,而不是显示数据,所以这也是它和HTML的一个明显的差别。另外一个差别是XML的标签没有被预定义,我们可以根据自己的需要自行设计标签名字,所以具有自我描述性。
一个具体的例子<?xml version="1.0" encoding="UTF-8"?>
以上就是一个XML的例子,它拥有发送者和接受者,标题,内容等信息,所以自我描述非常清晰。但是这个文档实际上只是包装了一些数据信息,而并没有做任何传输、接收和显示文档的信息,也就说你可以把他当成一个纯文本。纯文本的特点会让你在不同的操作系统进行数据共享的门槛大大降低。
XML结构XML文档是一种树结构,从根部开始扩展到枝叶。第1行是XML声明,它定义版本和编码。第2行是根元素,和第7行相对应,叫做起始标签,叫做结束标签,结束标签有一个"/"符号。
XML文档必须包含根元素,所有元素都可以拥有子元素。
XML文档均可拥有文本内容和属性。例如content元素下,属性time为noon,属性值要加引号。
XML文档元素必须要有结束标签,标签对大小写敏感,而且必须正确嵌套,也就是说一个标签必须完整地嵌套在另一个标签里。
开始读取文件,首先加载XML和RCurl包。library(XML)## Loading required package: bitopsurl
file_url
rootNode