R基础| 数据框基础

数据之帆

于 2023-12-16 11:11:16 发布

阅读量58

点赞数

文章标签： r语言笔记数据分析大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xingchen0101/article/details/135030171

版权

一文带你掌握数据框常用操作！

数据框是一种二维的数据结构，行表示观测/记录，列表示变量/指标/字段。数据框不同列的数据类型可以不同，但同一列的数据类型要相同，所有列的长度要相同。

数据框创建

ID <- 1:6
grade <- c(1,2,4,3,6,5)
subject <- c("Math","English","Chinese","History","Biology","Chemistry")
score <- c(90,95,92,88,97,91)
df <- data.frame(ID,grade,subject,score)

数据框索引、修改

# 位置方式
df[1,3]
df[,c(1,3)]
df[1:3,2]
# $方式
df$subject
# 名称方式
df[,'subject']
# 交互式修改
df2=edit(df) # edit不改变原始数据
fix(df) # fix改变原始数据

数据框添加、删除变量

# 加载R包中数据集
data("iris")
# 添加变量
iris2 <- transform(iris,variable=Petal.Length*Petal.Width)
# 删除变量
iris2[,-6]
iris2$Species <- NULL

数据框去重复

# 保留每种花的第一个记录
iris3 <- iris[!duplicated(iris$Species),]

数据框排序

# 行按照花萼长度从小到大的次序排
iris2 <- iris[order(iris$Sepal.Length,decreasing = F),]

常用函数

names(iris2)
colnames(iris2)
rownames(iris2)
dim(iris2)
nrow(iris2)
ncol(iris2)
# 查看前几行
head(iris2)
# 查看后几行
tail(iris2)
# 探索数据框结构
str(iris2)
summary(iris2)
# 求和、求平均
colMeans(iris2[,1:4])
colSums(iris2[,1:4])
# 转置
iris3 <- t(iris2)

缺失值

R中缺失值用符号NA（Not Available）表示，缺失值和空字符串的意义不同。

table(is.na(iris2))
# 缺失值
iris2[1,1] <- NA
# 空字符串
iris2[2,1] <- ""
# 移除所有含有缺失值的观测
iris2 <- na.omit(iris2)

思考题：

数据框和列表有哪些不同？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
R基础| 数据框基础

一文带你掌握数据框常用操作！数据框是一种二维的数据结构，行表示观测/记录，列表示变量/指标/字段。数据框不同列的数据类型可以不同，但同一列的数据类型要相同，所有列的长度要相同。
复制链接

扫一扫

数据之帆 CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

116万+: 周排名

18万+: 总排名

12万+: 访问

: 等级

470: 积分

158: 粉丝

236: 获赞

28: 评论

588: 收藏

私信

关注

热门文章

分类专栏

R语言 6篇
Python 1篇

最新评论

R实用绘图--桑基图 / networkD3 / 交互网络可视化
Whaito: 20231210
Sklearn安装（简明教程）
jrmsda1: 我也是这样，该怎么解决啊
R进阶绘图--散点箱线图+显著性 / 组间差异比较 / ggpubr包
CSDN-Ada助手: 恭喜您写了第19篇博客！标题看上去非常有吸引力，特别是涉及到散点箱线图和显著性的内容。您的博客内容一直给读者带来很多有价值的知识和技巧，我非常期待能够阅读这篇新的博客。不过，如果我可以提供一些建议的话，我觉得您可以考虑在未来的创作中深入探讨一些与R绘图相关的主题。比如，您可以介绍一些高级的绘图技巧，或者分享一些实际应用中的案例分析。这样，读者不仅能够学到更多知识，还能够将这些技巧应用到实际问题中。再次恭喜您的持续创作，期待您的下一篇博客！
R进阶绘图--散点图+统计分布图/ggpubr包/aplot包/gridExtra包
CSDN-Ada助手: 尊敬的博主，恭喜您发布了第20篇博客！您对R语言绘图的深入探索和分享让我受益匪浅。散点图和统计分布图的结合确实是一个非常有趣的主题，而且您对ggpubr包、aplot包和gridExtra包的介绍也让我受益匪浅。在阅读您的博客后，我希望能看到更多关于R语言绘图方面的探索，比如不同包的比较和应用、绘图技巧的分享等。希望您可以继续保持创作的热情，为我们带来更多有价值的内容。谢谢您的分享，期待您的下一篇博客！
R实用绘图--弦图 / circlize包
CSDN-Ada助手: 恭喜您写了这么一篇精彩的博客！弦图 / circlize包的介绍让我受益匪浅。不过，我想提个建议，希望您能在下一篇博客中结合实际案例，更具体地展示如何使用这些工具解决实际问题。谢谢您的分享，期待您更多的精彩内容！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。