xml文件格式_记录一下踩过的坑之xml(既是个R包,也是种文件格式)

除了html格式之外,不得不说一说xml格式,其实我最初并不是要去弄懂xml,而是为了搞明白rss格式。通俗一点讲,rss格式的文件是为了传播文章等信息用的,方便大家阅读的。其实绝大多数SCI期刊都有这种文件或者链接。它的本质还是xml文件。在python等语言中是由专门的库莱解析rss的。R中用来解析xml文件的包叫XML。但是这种包两个很大的弊端:一是不支持https链接,只支持http链接。二是不支持CSS选择器来查找节点。

为了解决这两大问题,只能另想门道了。

(1)解决https连接问题:

journal ".txt")url "https://www.frontiersin.org/journals/plant-science/rss"downloader::download(url,destfile = journal, quiet = TRUE)sci 

这种方法也是我在本地运行的时候想到的。当我从R里直接读取xml文件(其实后缀无所谓,txt就可以),然后运行xmlParse居然成功了。但是其中也有个问题,就是读取的时候,这个文件的第一行必须是以

进而想到先用命令把xml网页下载下来,存到系统中,再读取就可以了,试了一下,成功了。

(2)这个木办法,包的架构在那里。乖乖使用吧。af1488ceaaa28f774ed106b01123483f.png

--------shinyapp里踩过的坑

app里的期刊目前才20个,以后每天加个三五个吧。

79c98da16f0852ea51fd939d0a6b2d3b.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值