R语言:使用rvest包进行数据简单抓取

本文主要介绍用rvest包对天气后报网的空气数据进行简单的抓取。
具体代码如下:

本文抓取了2013年10月28日至2017年12月31日天气后报网的空气数据。
####################################
# GET THE DATA FROM TIAN-QI-HOU-BAO# 
####################################
#USE THE PACKAGES RVEST
library(rvest)
#BULID A FUNCTION
fun <- function(m){
       url <- paste0("http://www.tianqihoubao.com/aqi/beijing-",m,".html")
       html_session(url) 
       web<-html(url,encoding="gb2312")
       qq <- web %>% html_nodes("td") %>% html_text() 
       m <- matrix(qq,nrow=10)                       
       p <- t(m)                                      
       p <- iconv(p,"utf-8","gbk")                   
       p <- gsub("^\\s+|\\s+$","",p)                  
       p[-1,]
}
#GET THE DATA ABOUT AIR OF BEIJING 
#2013
air <- data.frame(fun(201310))
air <- rbind(air,data.frame(fun(201311)))
air <- rbind(air,data.frame(fun(20
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值