R语言学习笔记(八)--读写文件与网络爬虫

1 工作路径

  • getwd(): 获取工作
  • setwd(dir): 设置工作路径

注意:dir中的\需要变成 \\或者/才能够被识别,因为\是转义字符的意思,只有在转义字符后面再次加上\才能表达原始含义。

2 保存R对象

save(..., list, file)
  • … 要保存的多个R对象的名字
  • list: 一个字符串向量给出要保存的R对象的名字
  • file: 可给出要保存的文件名
save.image(file = ".RData")
  • 保存当前工作空间内的全部对象
load(file, envir, verbose)
  • envir: 数据要重新载入的目标环境
  • verbose: 输出重新载入的对象名
> y <- matrix(1:12,nrow=3)
> z <- list(Tag1=1:5,Tag2=c(T,F,F,T,F),Tag3=c("北京","上海","深圳"))
> save(y,z,file="yz.RData")
=================================
> rm(list=ls())
> load("yz.RData",verbose = T) #重新加载保存的R对象
Loading objects:
  y
  z

在这里插入图片描述

3 Scan函数

scan(file, what, sep, fileEncoding)
  • 从控制台、文件、连接、URL读取数据
  • file: 读取数据的文件名
    – 默认是“”,此时从控制台(键盘)读取
    – 文件名
    – file函数打开的一个连接(connection)
    – url函数创建的URL
  • what: 数据类型,默认是double, 传递character()或任意字符串就可以读取字符型数据了。
  • sep: 分隔符,默认是空白字符,即空格、TAB、换行
  • fileEncoding: 文件的字符集,中文常用的有UTF-8和GB18030

3-1 从控制台读取数据

空行结束输入:

> num <- scan()
1: 12
2: 3
3: 4
4: 78
5: 5
6: 
Read 5 items

> num
[1] 12  3  4 78  5

3-2 从txt文件读取数据

scan("data_utf8.txt", what="", fileEncoding="UTF-8")

3-3 从url读取数据

> t <- url("https://www.r-project.org/COPYING",encoding ="UTF-8")
> class(t) # "url" "connection"
[1] "url"        "connection"
> d<-scan(t, what=character() )
Read 2969 items
> head(d,n=20)
 [1] "GNU"         "GENERAL"     "PUBLIC"      "LICENSE"    
 [5] "Version"     "2,"          "June"        "1991"       
 [9] "Copyright"   "(C)"         "1989,"       "1991"       
[13] "Free"        "Software"    "Foundation," "Inc."       
[17] "59"          "Temple"      "Place,"      "Suite" 

在这里插入图片描述

4 按行读写文本文件

readLines(con, n
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
R语言实战笔记第九章介绍了方差分析的内容。方差分析是一种用于比较两个或多个组之间差异的统计方法。在R语言中,可以使用lm函数进行方差分析的回归拟合。lm函数的基本用法是: myfit <- lm(I(Y^(a))~x I(x^2) I(log(x)) var ... [-1],data=dataframe 其中,Y代表因变量,x代表自变量,a代表指数,var代表其他可能对模型有影响的变量。lm函数可以拟合回归模型并提供相关分析结果。 在方差分析中,还需要进行数据诊断,以确保模型的可靠性。其中几个重要的诊断包括异常观测值、离群点和高杠杆值点。异常观测值对于回归分析来说非常重要,可以通过Q-Q图和outlierTest函数来检测。离群点在Q-Q图中表示落在置信区间之外的点,需要删除后重新拟合并再次进行显著性检验。高杠杆值点是指在自变量因子空间中的离群点,可以通过帽子统计量来识别。一般来说,帽子统计量高于均值的2到3倍即可标记为高杠杆值点。 此外,方差分析还需要关注正态性。可以使用car包的qqplot函数绘制Q-Q图,并通过线的位置来判断数据是否服从正态分布。落在置信区间内为优,落在置信区间之外为异常点,需要进行处理。还可以通过绘制学生化残差的直方图和密度图来评估正态性。 综上所述,R语言实战第九章介绍了方差分析及其相关的数据诊断方法,包括异常观测值、离群点、高杠杆值点和正态性检验。这些方法可以用于分析数据的可靠性和模型的适应性。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [R语言实战笔记--第章 OLS回归分析](https://blog.csdn.net/gdyflxw/article/details/53870535)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值