R语言入门第二集 实验一:R 语言数据结构、数据导入与数据处理

R语言入门第二集 实验一:R 语言数据结构、数据导入与数据处理



一、资源

R语言基本数据结构练习和数据的导入和处理对象常用函数练习——东北大学大数据班R语言实训第一次作业"

R(4)求解数据行的平均值,显示某一行或者某一列

R语言查看对象类型和长度

R语言怎么获取行数

RStudio两个快捷方式,快速注释 & 批量首末加符号等 (R)



二、答案更新纠正

  1. 2.8 向量C的最大值及最大值对应的索引

    答案:

    C[which.max(C)]
    CMaxIndex<-which.max(C)
    CMaxIndex
    
    

    应该为:

    2.8 向量C的长度,最大值及其索引

    length(C)
    C[which.max(C)]
    CMaxIndex<-which.max(C)
    CMaxIndex
    
    
  2. 3.3 输出algae1的概要信息,数据的维度,字段名称,查看season、size和NO3各列的数据类型

    答案:

    summary(algae1)
    dim(algae1)
    colnames(algae1)    
    str(algae1$season)
    str(algae1$size)
    str(algae1$NO3)
    
    

    应该为:

    summary(algae1)
    dim(algae1)
    colnames(algae1)  
    class(algae1$season)
    class(algae1$size)
    class(algae1$NO3)
    
  3. 3.4 选出季节为夏天的样本保存到newalgael中,输出newalgael样本行数

    答案:

    newalgae1<-algae1[algae1$season=="summer",]
    newalgae1
    
    

    应该为:

    newalgae1<-algae1[algae1$season=="summer",]
    nrow(newalgae1)
    


三、答案

实验一 R语言数据结构、数据导入与数据处理

1.安装R环境,熟悉环境,熟悉R NOTEBOOK的用法

2.基本数据结构练习
2.1 创建数值从1到10,间隔为2,名称为A的向量

A<-seq(1,10,2)
A

2.2 将数字1到12每个重复3次写入向量B中:(1,1,1,…,12,12,12) 提示rep函数

B<-rep(1:12,each=3)
B

2.3 输出B向量的长度和去重后的向量数值

length(B)
unique(B)

2.4 输出A和B的交集,并集C ,差集

intersect(A,B)
C<-union(A,B)
C
setdiff(B,A)

2.5 将集合C按降序排序

sort(C,decreasing = T)

2.6 选取C的第3个元素;第4到最后的元素;数值大于等于3小于7的元素

C[3]
C[4:12]
subset(C,C>=3&C<7)

2.7 将数值型向量C转化为字符型

class(C)
D <- as.character(C)
class(D)

2.8 向量C的长度,最大值及其索引

length(C)
C[which.max(C)]
CMaxIndex<-which.max(C)
CMaxIndex

2.9 将A转化成数组类型,变量名为a,查看a的类型

class(A)
a<-array(A)
class(a)

2.10 用1~20的数字构成两个4*5的矩阵,其中M1为按列输入,M2为按行输入,计算M3为M1+M2;并构建M4,它由M3各列构成,但不包含第3列。

M1<-matrix(1:20,c(4,5))
M1
M2<-matrix(1:20,c(4,5),byrow = TRUE)
M2
M3<-M1+M2
M3
M4<-M3[,-3]
M4

2.11 用1~9的数字构成一个3*3的按列输入的矩阵M5;求M5的对角阵M6;计算M5与M6的矩阵乘法得到M7;求M7的转置矩阵M8

M5<-matrix(1:9,c(3,3))
M5
M6<-diag(diag(M5))
M6
M7<-M5%*%M6
M7
M8<-t(M7)
M8

2.12 用1~12的数字构成一个4*3的按列输入的矩阵M9,求M9的列加和;求M9的行平均

M9 <- matrix(1:12, c(4, 3))
M9
colSums(M9)
rowMeans(M9)

3.数据的导入和处理对象常用函数练习
3.1 从csv文件中读取algae数据集赋值给algae1

algae1<-read.csv("algae.csv")

3.2 查看algae1的前10条数据

head(algae1, n = 10)

3.3 输出algae1的概要信息,数据的维度,字段名称,查看season、size和NO3各列的数据类型

summary(algae1)
dim(algae1)
colnames(algae1)  
class(algae1$season)
class(algae1$size)
class(algae1$NO3)

3.4 选出季节为夏天的样本保存到newalgael中,输出newalgael样本行数

newalgae1<-algae1[algae1$season=="summer",]
nrow(newalgae1)

3.5 将newalgael的列cl中的缺失值用本列的中位数填充

newalgae1$Cl
newalgae1$Cl[is.na(newalgae1$Cl)]<- median(newalgae1$Cl,na.rm = TRUE) 
newalgae1$Cl

3.6 将algae1删除含有缺失值的样本,输出原始样本的行数和剩余样本行数

nrow(algae1)
algae1<-na.omit(algae1)
nrow(algae1)

3.7 编辑algae1并另存为algae2(任意修改某个点的值)

algae2<-edit(algae1)

3.8 将algae1和algae2,按行合并得到algae3,输出algae1、algae2 和algae3的样本行数

algae3<-rbind(algae1,algae2)
nrow(algae1)
nrow(algae2)
nrow(algae3)
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
第1章 为什么学习R语言 1 1.1 R是什么 2 1.1.1 R是yi款悠秀的现代科研 软件 2 1.1.2 R的优势与不足 3 1.1.3 R和Python的区别 3 1.2 计算社会科学的兴起——以计算 传播学为例 4 1.2.1 什么是计算社会科学 4 1.2.2 计算传播学的起源和概念 7 1.3 R在计算传播学中的典型应用 9 1.3.1 用R进行文本分析初探 9 1.3.2 互联网在线数据收集 10 1.3.3 社会网络分析 12 1.4 总结与提高 13 1.5 习题 14 第2章 R语言开发环境 15 2.1 R的获取、安装和基本使用 16 2.1.1 RGui的下载与安装 16 2.1.2 RGui的使用介绍 19 2.1.3 示例:使用R Commander实现 统计功能 21 2.1.4 R的内置数据集和扩展 功能包 26 2.1.5 R的帮助系统 27 2.1.6 R的工作空间和工作目录 27 2.2 R的IDE开发环境——RStudio 27 2.2.1 RStudio的下载和安装 28 2.2.2 RStudio的zui简标准操作 28 2.2.3 RStudio的工作界面 31 2.2.4 RStudio的用户自定义配置 32 2.3 示例:我的diyi个R项目 “网页爬虫” 32 2.3.1 组织项目需求 33 2.3.2 新建项目环境 33 2.3.3 编写应用程序代码并运行 34 2.3.4 执行代码并根据实际结果修改 和再次运行 35 2.4 总结与提高 37 2.5 习题 38 第3章 R语言基础——数据 39 3.1 无障碍学习编程语言的两个 诀窍 40 3.1.1 从“哲学”的角度了解编程 语言 40 3.1.2 从“语言学”的角度学习编程 语言语法 41 3.2 R的基本数据类型(数值、字符、 逻辑) 42 3.2.1 基本数据类型 42 3.2.2 数据类型的两个属性:模式和 长度 43 3.2.3 两个特殊常量 44 3.3 R的复合数据类型 45 3.3.1 向量 46 3.3.2 矩阵 46 3.3.3 数组 47 3.3.4 数据框 48 3.3.5 列表 49 3.3.6 因子 51 3.3.7 时间序列 52 3.4 数据导入和导出 54 3.4.1 数据导入 55 3.4.2 数据的导出 59 3.5 总结与提高 59 3.6 习题 59 第4章 R语言基础——代码 61 4.1 R代码的基本单位:语句= 数据 运算符; 62 4.1.1 基本运算符 62 4.1.2 表达式、语句、语句块 65 4.2 R的流程控制 66 4.2.1 顺序结构 66 4.2.2 选择/分支结构 67 4.2.3 循环结构 70 4.3 R代码复用——函数和过程 73 4.3.1 “模块化”编程思想与函数 73 4.3.2 函数的定义与调用 75 4.3.3 过程的定义与调用 76 4.4 总结与提高 77 4.5 习题 77 第5章 R绘图——数据可视化呈现 79 5.1 概述 80 5.2 R的绘图函数 81 5.2.1 图形窗口绘图操作函数(图形的 创建和保存) 82 5.2.2 R图形参数 83 5.2.3 高级绘图函数 86 5.2.4 低级绘图函数 89 5.3 常用的R可视化功能包 91 5.3.1 ggplot2功能包 91 5.3.2 rCharts功能包 93 5.3.3 plotly功能包 95 5.3.4 map功能包 96 5.4 总结与提高 97 5.5 习题 98 第6章 网络数据程序化采集 99 6.1 网络数据的获取途径及相关 基础知识 100 6.1.1 Web数据的获取途径 100 6.1.2 Web的结构与原理 101 6.2 使用R收集Web数据 106 6.2.1 获取静态Web内容 107 6.2.2 网络数据的应用级API采集 (以豆瓣为例) 109 6.2.3 获取动态Web内容 111 6.3 总结与提高 114 6.4 习题 114 第7章 文本挖掘和情感分析 115 7.1 R环境下的文本挖掘 116 7.1.1 中文分词 117 7.1.2 分词包jiebaR的使用 118 7.1.3 词云包wordcloud2的使用 127 7.2 情感分析 129 7.2.1 情感分析概述 129 7.2.2 情感分析的简单实现 131 7.3 总结与提高 133 7.4 习题 133 第8章 社会网络分析 135 8.1 网络社会与社会网络分析 136 8.1.1 社会的构成 136 8.1.2 网络社会与社会网络分析 137 8.1.3 现代网络社会与社会网络 分析 140 8.1.4 网络与关系的描述 142 8.2 社会网络分析的发展、意义 和步骤 143 8.2.1 社会网络分析的三个方向 143 8.2.2 社会网络分析的几个主要 步骤 144 8.2.3 社会网络分析的几个重要 指标 144 8.3 社会网络分析的常用工具 146 8.3.1 NodeXL的使用 146 8.3.2 R的iGraph功能包 147 8.3.3 UCINET 149 8.4 总结与提高 149 8.5 习题 150 第9章 社交编程平台:GitHub 151 9.1 自己架设PHP实验站点并深入 探索RCurl功能包 152 9.1.1 基于PHP网页服务器端技术 架设网站实验环境 152 9.1.2 深入探索RCurl包 157 9.2 挖掘和分析社交编程平台GitHub的 信息 162 9.2.1 GitHub的基本使用 162 9.2.2 探索GitHub API 165 9.3 总结与提高 175 9.4 习题 175 附录 177 附录1 计算社会科学宣言 177 附录2 计算传播学:宣言与版图 182 附录3 服务器版RStudio的安装与 配置(基于Ubuntu14.04) 191 附录4 RStudio的常用快捷键 192 附录5 使用devtools包从GitHub 中安装R包 196 附录6 使用Rtools自制R扩展 软件包 197 参考文献 203

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值