R语言RSelenium包爬取动态网页数据前期准备(环境配置)-连载NO.01

生而为人,学无止境。

 

作为爬虫爱好者,最开始的时候多少都会遇到爬取的时候返回各种bug,抓头挠耳吧;

R语言爬虫的包基础的就是rvest和RCurl,解析的就是xml包,当然你还得有html、css、http协议;

但基本的包仅对于静态网页的爬取比较有效,而对于动态网页(渲染网页)就没用了;

接下来写一下R语言里面对于动态网页爬取(AJAX异步渲染/加载网页)的前期环境配置/搭建(模拟浏览器操作)。这里讲的是Rselenium的,至于Rwebdriver包的话类似,但现在它的包不好下载。

1、基于Rselenium包的环境搭建

install.packages("RSelenium")
library(RSelenium)
#浏览器控制函数
remdr <- remoteDriver(browserName ="firefox")

# 打开浏览器,运行这你会很惊喜
remdr$open()

若你直接下载Rselenium并加载,然后打开浏览器的话就会立马报错:

当然这肯定是错误的做法,但同时你也可以看到它的一点提示:Unable to create new service: GeckoDriverService

GeckoDriver是firefox浏览器的驱动,忘了说,这里是以fi

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LEEBELOVED

一分钱都是爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值