R语言学习笔记（八）--读写文件与网络爬虫

最新推荐文章于 2020-08-23 21:15:00 发布

yichao0630

最新推荐文章于 2020-08-23 21:15:00 发布

阅读量2k

点赞数

分类专栏： R学习笔记文章标签： r语言

本文链接：https://blog.csdn.net/yichao0630/article/details/106072813

版权

1 工作路径

getwd(): 获取工作
setwd(dir): 设置工作路径

注意：dir中的\需要变成 \\或者/才能够被识别，因为\是转义字符的意思，只有在转义字符后面再次加上\才能表达原始含义。

2 保存R对象

save(..., list, file)

… 要保存的多个R对象的名字
list: 一个字符串向量给出要保存的R对象的名字
file: 可给出要保存的文件名

save.image(file = ".RData")

保存当前工作空间内的全部对象

load(file, envir, verbose)

envir: 数据要重新载入的目标环境
verbose: 输出重新载入的对象名

> y <- matrix(1:12,nrow=3)
> z <- list(Tag1=1:5,Tag2=c(T,F,F,T,F),Tag3=c("北京","上海","深圳"))
> save(y,z,file="yz.RData")
=================================
> rm(list=ls())
> load("yz.RData",verbose = T) #重新加载保存的R对象
Loading objects:
  y
  z

在这里插入图片描述

3 Scan函数

scan(file, what, sep, fileEncoding)

从控制台、文件、连接、URL读取数据
file: 读取数据的文件名
– 默认是“”，此时从控制台(键盘)读取
– 文件名
– file函数打开的一个连接(connection)
– url函数创建的URL
what: 数据类型，默认是double, 传递character()或任意字符串就可以读取字符型数据了。
sep: 分隔符，默认是空白字符，即空格、TAB、换行
fileEncoding: 文件的字符集，中文常用的有UTF-8和GB18030

3-1 从控制台读取数据

空行结束输入：

> num <- scan()
1: 12
2: 3
3: 4
4: 78
5: 5
6: 
Read 5 items

> num
[1] 12  3  4 78  5

3-2 从txt文件读取数据

scan("data_utf8.txt", what="", fileEncoding="UTF-8")

3-3 从url读取数据

> t <- url("https://www.r-project.org/COPYING",encoding ="UTF-8")
> class(t) # "url" "connection"
[1] "url"        "connection"
> d<-scan(t, what=character() )
Read 2969 items
> head(d,n=20)
 [1] "GNU"         "GENERAL"     "PUBLIC"      "LICENSE"    
 [5] "Version"     "2,"          "June"        "1991"       
 [9] "Copyright"   "(C)"         "1989,"       "1991"       
[13] "Free"        "Software"    "Foundation," "Inc."       
[17] "59"          "Temple"      "Place,"      "Suite"

在这里插入图片描述

4 按行读写文本文件

readLines(con, n

最低0.47元/天解锁文章

yichao0630

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
R语言学习笔记（八）--读写文件与网络爬虫

R语言学习笔记（八）1 工作路径2 保存R对象3 Scan函数3-1 从控制台读取数据3-2 从txt文件读取数据3-3 从url读取数据4 按行读写文本文件5 读取文本文件（txt、csv）6 处理CSV、Excel、XML、JSON文件6-1 读写Excel文件[xlsx包 or readxl包]6-2 解析XML文件6-2-1 处理utf-8的XML文档将xml转换成dataframe：将xml转换成List6-2-2 处理GB18030的XML文件将xml转换成dataframe将xml转换成Lis
复制链接

扫一扫