R语言中利用XML进行数据抓取时,报错Error: failed to load external entity。
可以结合RCurl库进行数据抓取。
示例代码如下:
library(XML)
library(RCurl)
urlData = paste0("http://www.amazon.cn/gp/bestsellers/digital-text/116169071/ref=sa_menu_kindle_l3_116169071#",1:5)
URL <- getURL(urlData)
Sys.sleep(runif(1,1,2))
doc <- htmlParse(URL[1], encoding = "UTF-8")
至于为什么报错,有待分析!