数据收集(爬取等)——> 数据处理 ——> 数据可视化
RCurl包、 XML包:
安装
#安装RCurl,要加引号
install.packages('RCurl')
一、使用RCurl包
1、获取文件名
#1.加载包
library(RCurl)
#2.定义变量,保存url地址
url <- 'http://rfunction.com/code/1202/'
#3.获取网页所有内容的源代码,返回值是字符串类型
html <- getURL(url)
#4.截取文件名字(需求),使用分割函数 strsplit(a-b-c,'-')
#判断是否是向量,要保证是向量才能使用分割函数
is.vector(temp)
#将列表转化成向量型
unlist(temp)
temp <- strsplit(temp,'')
#5、对列表中的每个元素进行处理,返回每个元素中的第一个值;
#格式如下:lapply(列表,function(x){x[1]})
#function(x){x[1]} 回调函数,里面的x指的是列表中的每一个元素
filenames <- lapply(temp,function(x){x[1]})
#7.将filenames转化成向量格式
filenames <- unlist(filenames)
#8.将filenames中的第一个和第一个值和第二个值过滤掉
filenames <- filenames[-c[1,2]]
2、使用循环下