系列文章目录
实验数据
1. algae 数据集
season | size | speed | mxPH | mnO2 | Cl |
Cl | NO3 | NH4 | oPO4 | PO4 | Chla |
a1 | a2 | a3 | a4 | a5 | a6 |
a7 |
提示:以下是本篇文章正文内容
一、实验目的
- 安装 R 环境,熟悉环境,熟悉 R NOTEBOOK 的用法。
- 数据集的创建:数据集(data set)是一个数据的集合,通常以数据库表格的形式出现。
- 基本的数据结构:向量、矩阵、数组、数据框、因子、列表。
- 数据的输入和导入:R 支持很多种输入和导入。
- 处理数据对象的常用函数:如:dim()查看某对象的维度;class()查看某对象的类型;head()查看某对象的开始部分;tail()查看某对象的结尾部分;cbind()按列合并对象;rbind()按行合并对象。
二、实验内容
题目1 基本数据结构练习
- 创建数值从 1 到 10,间隔为 2,名称为 A 的向量。
- 将数字 1 到 12 每个重复 3 次写入向量 B 中:(1,1,1,…,12,12,12) 提示 rep 函数。
- 输出 B 向量的长度和去重后的向量数值。
- 输出 A、B 的交集,并集 C ,差集。
- 将集合 C 按降序排序。
- 选取 C 的第 3 个元素;第 4 到最后的元素;数值在区间大于等于 3 小于 7的元素。
- 将数值型向量 C 转化为字符型。
- 向量 C 的长度,最大值及其索引。
- 将 A 转化成数组类型变量名为 a,查看 a 的类型。
- 用 1~20 的数字构成两个 4*5 的矩阵,其中 M1 为按列输入,M2 为按行输入,计算 M3 为 M1+M2;并构建 M4,它由 M3 各列构成,但不包含第 3 列。
- 用 1~9 的数字构成一个 3*3 的按列输入的矩阵 M5;求 M5 的对角阵
M6;计算 M5 与 M6 的矩阵乘法得到 M7;求 M7 的转置矩阵 M8。 - 用 1~12 的数字构成一个 4*3 的按列输入的矩阵 M9,求 M9 的列加和;求 M9 的行平均。
题目2 数据的导入和处理对象常用函数练习
- 从 csv 文件中读取 algae 数据集赋值给 algae1。
- 查看 algae1 的前 10 条数据。
- 输出 algae1 的基本统计信息,数据的维度,特征名称,查看season、size和 NO3 各列的数据类型。
- 选出季节为夏天的样本存在 newalgael,输出 newalgael 样本行数。
- 将 newalgael 的列 cl 中的缺失值用本列得中位数填充。
- 将 algae1 删除含有缺失值的样本,输出原始样本的行数和剩余样本行数。
- 编辑 algae1 并另存为 algae2(任意修改某个点的值)。
- 将 algae1 和 algae2,按行合并得到 algae3,输出 algae1、algae2 和algae3 的样本行数。
三、实现过程与实验结果
题目1 基本数据结构练习
1.创建数值从1到10,间隔为2,名称为A的向量。
A <- seq(1, 10, 2)
A
## [1] 1 3 5 7 9
2.将数字 1 到 12 每个重复 3 次写入向量B中:(1,1,1,…,12,12,12)。
B <- rep(1:12, each = 3)
B
## [1] 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 6 6 6 7 7 7 8 8 8 9
## [26] 9 9 10 10 10 11 11 11 12 12 12
3.输出 B 向量的长度和去重后的向量数值。
# B向量的长度
length(B)
## [1] 36
# 去重后的向量数值
unique(B)
## [1] 1 2 3 4 5 6 7 8 9 10 11 12
4.输出 A、B 的交集、并集 C、差集。
# A、B的交集
intersect(A, B)