首先下载Selenium,下载好之后打开命令窗口,将Selenium的jar包放入命令窗口的路径下,输入 java -jar selenium-server-standalone-3.9.1.jar
最后显示Selenium Server is up and running on port 4444,表示已经启动成功!
使用RSelenium包控制浏览器主要依靠remoteDriver系列函数:
remoteDriver( remoteServerAddr,
port,
browserName,
path,
version,
platform,
javascript,
nativeEvents,
serverURL,
sessionInfo)
其中,参数remoteServerAddr,表示远程服务器的IP地址,默认值是本机地址,是character型;
参数port,表示远程服务器连接端口,是numeric型;
参数browserName,表示浏览器名称,可以取chrome、firefox、htmlunit、internetexplorer或iphone,是character型;
参数path,表示远程服务器上命令的基本URL路径前缀,默认值是“/ wd / hub”;
参数version,表示浏览器版本,是character型;
参数platform,表示浏览器运行的系统,可以是WINDOWS、XP、VISTA、MAC、LINUX或UNIX,是character型;
参数javascript,表示会话是否支持在当前页面的上下文中执行用户提供的JavaScript,是logical型;
参数nativeEvents,表示会话是否支持本地事件,是logical型;
参数serverURL,表示JSON请求发送到的远程服务器的URL,是character型;
参数sessionInfo,表示会话相关信息,是list型。
通常情况下,只要设置browserName就可以对浏览器进行操作。remoteDriver函数的返回值是一系列函数,其中open用于打开浏览器,navigate用于打开网页:
rm(list = ls())
library(RSelenium)
library(Rcurl)
library(bitops)
library(RJSONIO)
library(Rwebdriver)
### 打开浏览器
remDr <- remoteDriver(browserName = "chrome",
remoteServerAddr = "localhost",
port = 4444L
)
remDr$open()
#### 打开网页
url <- 'http://www.baidu.com'
remDr$navigate(url)