![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
HTML/XML
风风雨雨中寻觅
平平淡淡,简简单单,取长补短,修炼身心
展开
-
R语言中处理XML/HTML函数详解-爬虫相关
本篇介绍XML 程序包中的函数,因函数较多,侧重于爬虫相关的函数1.xmlTreeParse(),htmlTreeParse() #解析XML或HTML文件,或者包含XML/HTML内容的字符串,并生成标准的XML/HTML树形R结构,当内容已知为HTML时,使用后者(XMLDocumentContent:生成对象类型)2.xmlParse(),htmlParse() #整理网页树结构,与...原创 2018-08-06 20:00:33 · 3863 阅读 · 0 评论 -
HTML基础
网络前端最核心三大技术HTML、CSS、JavaScript。HTML全称超文本标记语言(hyper text Markup language)是一种在网页上展示内容的语言(非编程语言,是一种描述内容并定义其表征的标记语言)。HTML是树状结构,从内容上就是标签、元素、属性,需注意HTML注释方式,保留字符和文档定义1.标签、元素和属性标签指的是会指定其中包装的文本作为在浏览器分页的标题栏...原创 2019-01-03 20:46:35 · 121 阅读 · 0 评论 -
XML基础
XML(extensible Markup Language)全称可扩展标记语言,首先它与HTML一样是标记语言,那就具有标记语言全部特征。同时XML是被设计用来传输与存储数据,这和HTML用来显示数据大不一样,所以XML又有网络数据交换最流行格式的美誉编写XML文档需自行定义标签,XML被设计为具有自我描述性。作为一种纯文本格式,任何有处理纯文本能力的软件都可以用来处理XML语法规则...原创 2019-01-04 10:42:22 · 135 阅读 · 0 评论 -
XPath表达式
XPath表达式是查询标记语言的方法(是选取XML或HTML中节点node的方法,节点通常是指XML/HTML中元素),XPath通过路径表达式(Path Expression)来选择节点信息,跟文件系统路径一样用/符号来分割路径同一个节点有绝对路径与相对路径两种写法;1.绝对路径必须以/起首,后面紧跟根节点/step/step/...;2.相对路径step/step/.... 当...原创 2019-01-04 11:22:43 · 1039 阅读 · 0 评论