#XML的缺点是对中文支持不够好
library(RCurl)
library(XML)
url="http://data.earthquake.cn/datashare/globeEarthquake_csn.html"
wp=getURL(url)
doc=htmlParse(wp,asText=T)
tables=readHTMLTable(doc,header=F,which=6)
#基于html中的关键字"table"进行筛选,"which=6”表示第6个表单
tables
R网络爬虫之表格下载
最新推荐文章于 2024-04-22 08:40:16 发布