R语言入门-数据分析DataFrame

目录

读取数据

添加平均工资列 

 筛选操作

我想知道上海的工作有哪些?

 北上广深的工作机会占比?

聚合数据

北上广深城市薪资的平均值 ?

排序

使用ggplot2包做堆积柱状图


今天学习一下R语言中重要的对象类型DataFrame(数据框)

读取数据

读取数据,采用的数据是网络数据类工作的招聘信息,包含职位关键词、城市、公司名、学历要求、经验要求、职位名称、技术栈要求、最高工资、最低工资,用read.csv()来读取该文件,用View()来查看

##读取文件并查看
job_data <- read.csv("C:/Users/ABC/Desktop/《数据分析师求职面试指南》书籍资源/数据、代码/4.2/R语言数据分析.csv")
View(job_data)

添加平均工资列 

来一起看看岗位的平均工资,这里简单用(最高工资+最低工资)/ 2 来计算,添加一列salary

#基于以上数据,对数据框进行相关操作。可以添加一列,计算每条薪资数据的平均值,并查看每一列数据的类型
job_data$salary <- (job_data$salary_high + job_data$salary_low) / 2
lapply(job_data,'class')

 筛选操作

我想知道上海的工作有哪些?

#筛选数据,我想知道上海的工作有哪些?
job_data_shanghai <- subset(job_data,city == '上海')
View(job_data_shanghai)

 我想知道北上广深的工作有哪些?

#筛选数据,我想知道北上广深的工作有哪些?
job_data_bsgs <- subset(job_data,city %in% c('北京','上海','深圳','广州'))
View(job_data_bsgs)

 北上广深的工作机会占比?

#求一下北上广深的工作占所有工作的比例
print(nrow(job_data_bsgs) / nrow(job_data))

聚合数据

北上广深城市薪资的平均值 ?

#聚合数据,计算北上广深城市薪资的平均值
city_job_data <-aggregate(job_data_bsgs$salary,by = list(job_data_bsgs$city,job_data_bsgs$experience),
                                                    FUN=mean)
colnames(city_job_data) <- c('city','salary','experience')
View(city_job_data)

 

 

排序

#数据排序,按照北上广深的薪资平均值从高到低进行排序
city_job_data[order(city_job_data$salary,decreasing = T),]

 ​​​​​​​

使用ggplot2包做堆积柱状图

install.packages('ggplot2')
library(ggplot2)

##柱状图
ggplot(city_job_data,aes(x=city,y=salary,fill=experience))+
  geom_bar(stat='identity',position='stack')

 

 

  • 9
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Terry_trans

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值