【R语言 数据探索】实战 Diamonds数据集探索

1.主要内容

查看数据
diamonds 

截取子集
set.seed(123)
diamonds <- diamonds[sample(nrow(diamonds), 1000),]

查看概要
summary()str()

探索
价格和克拉的关系:geom_point(),映射颜色和形状

价格分布:geom_histogram(),映射填充、position="fill"/"dodge"

透明度分布:geom_bar()

价格概率分布:geom_density(),映射颜色、填充

不同切工下的价格分布:geom_boxplot(),映射填充

坐标变换:scale_y_log10()

加上坐标轴标签和标题:labs(x="", y="", title="")

2.数据集
这里写图片描述

rm(list=ls())
gc()

options(scipen = 200)

# 加载包和数据集
library(ggplot2)
library(gcookbook)
diamonds <- diamonds

# 截取子集
set.seed(123)
# 从全部行中采样出1000行
diamonds <- diamonds[sample(nrow(diamonds), 1000),]

# 查看数据框的一些概要信息
summary(diamonds)
str(diamonds)

# 查看数据框的前几行或最后几行
head(diamonds)
tail(diamonds)

# 价格和克拉的关系
ggplot(diamonds) + geom_point(aes(x=carat, y=price))
# 加入color和cut的影响
ggplot(diamonds) + geom_point(aes(x=carat, y=price, color=color, shape=cut))

# 价格分布
ggplot(diamonds) + geom_histogram(aes(x=price))
# 加入cut的影响
ggplot(diamonds) + geom_histogram(aes(x=price, fill=cut))
# 分组直方图
ggplot(diamonds) + geom_histogram(aes(x=price, fill=cut), position="dodge")
# 百分比直方图
ggplot(diamonds) + geom_histogram(aes(x=price, fill=cut), position="fill")

# 纯净度分布
ggplot(diamonds) + geom_bar(aes(x=clarity))
# 加入color的影响
ggplot(diamonds) + geom_bar(aes(x=clarity, fill=color))

# 价格的概率分布
ggplot(diamonds) + geom_density(aes(x=price))
# 加入cut的影响
ggplot(diamonds) + geom_density(aes(x=price, color=cut))
# 加入color的影响
ggplot(diamonds) + geom_density(aes(x=price, color=color))

# 不同切工下价格的分布
ggplot(diamonds) + geom_boxplot(aes(x=cut, y=price))
# 加入color的影响
ggplot(diamonds) + geom_boxplot(aes(x=cut, y=price, fill=color))

# 坐标变换
ggplot(diamonds) + geom_point(aes(x=carat, y=price, color=color, shape=cut)) + scale_y_log10()

# 加上标题和坐标轴标签
ggplot(diamonds) + geom_point(aes(x=carat, y=price, color=color, shape=cut)) + scale_y_log10() + labs(x='克拉', y='价格', title='克拉和价格之间的关系') + theme(text=element_text(family='Microsoft YaHei'))

?theme
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东华果汁哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值