爬取xml数据之R

最新推荐文章于 2020-09-30 21:06:05 发布

weixin_34354945

最新推荐文章于 2020-09-30 21:06:05 发布

阅读量96

点赞数

原文链接：http://www.cnblogs.com/ubiwind/p/9883151.html

版权

生物信息很多时候要爬数据。最近也看了一些这些方面的。

url<-"要爬取的网址"

url.html<-htmlParse(url,encoding="UTF-8")

如果要获得部分信息，则使用XPath方法。

xpath<-"//*[@id='填写目标id']/span[@id='细分标签的id']

目标id.node<-getNodeSet(url.html,xpath)

//表示任意个html嵌套标签

*表示任意个标签

/表示下一级，span则表示细分标签

如果要读取节点下表签内的内容，则使用xmlValue;xmlGetAttr则可以读取某个属性值

转载于:https://www.cnblogs.com/ubiwind/p/9883151.html

weixin_34354945

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取xml数据之R

生物信息很多时候要爬数据。最近也看了一些这些方面的。url<-"要爬取的网址"url.html<-htmlParse(url,encoding="UTF-8")如果要获得部分信息，则使用XPath方法。xpath<-"//*[@id='填写目标id']/span[@id='细分标签的id']目标id.node<-getNodeSet(url.html,x...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。