R语言与数据可视化-180705

2018.7.5作业

一、对文件的一些基本操作

1、对文件iris.csv中的数据进行一些简单的操作:

查看数据记得大小结构,维度,名称,属性
dim(iris)
names(iris)
str(iris)
查看数据前几行和后几行
iris[1:5,]

结果:
这里写图片描述

head(iris)
tail(iris)
#可以查找某一列的值
iris[1:10,"Sepal.Length"]
iris$Sepal.Length[1:10]
结果:

这里写图片描述

summary(iris)

这里写图片描述

mean(iris$Sepal.Length)
median(iris$Sepal.Length)

这里写图片描述

结果如下:
#查看方差,绘制直方图
var(iris$Sepal.Length)
hist(iris$Sepal.Length)

这里写图片描述

二、绘制统计图和点图

一、  对读者reader.txt进行分析:
1、  共多少读者
reader <- read.table(file = "f:/data/reader.txt", header=T, sep = "\t", quote = "",comment.char = "", stringsAsFactors =F)
#共多少读者
readerTotal <- nrow(reader)
readerTotal
结果如下:

这里写图片描述

2、  读者的不同身份
#不同地方读者的身份workplace_desc
workplace <-unique(reader$workplace_desc)
head(workplace)
结果如下:   

这里写图片描述

3、  不同读者的数量
#不同读者的数量
workplaceNum <- length(workplace)
workplaceNum

这里写图片描述

4# 不同读者的编码有几种
readercode<-unique(reader$reader_barcode)
head(readercode)
readercode <- length(readercode)
readercode

这里写图片描述

三、 对book.txt文件中内容进行分析:

1、  #书名信息展示title
titleStat <- table(book$title)
titleStat
N <- 10
titleTopN <- sort(titleStat, decreasing = T)[1:N]
titleTopN
titleFrame <- as.data.frame(titleTopN)
names(titleFrame) <- c("bookName", "Num")
library(ggplot2)
#条形图
p <- ggplot(data = titleFrame, aes(x = bookName, y=Num)) + geom_col(aes(fill=bookName)) +
  geom_text(aes(label=Num), vjust = -0.5) + theme(legend.position = "none", axis.text.x = element_text( angle = 270))
p
#点图
p <- ggplot(data = titleFrame, aes(x = bookName, y=Num)) + geom_point(aes(color=bookName))
p
条形图如下:

这里写图片描述
点图如下:
这里写图片描述

2、  同理可求出:读者信息排行榜展示
#读者排行榜展示workplace_desc  reader.txt
workStat <- table(reader$workplace_desc)
N <- 10
workTopN <- sort(workStat, decreasing = T)[1:N]
workFrame <- as.data.frame(workTopN)
names(workFrame) <- c("workplaceName", "Num")
library(ggplot2)
#条形图
p <- ggplot(data = workFrame, aes(x = workplaceName, y=Num)) + geom_col(aes(fill=workplaceName)) +
  geom_text(aes(label=Num), vjust = -0.5) + theme(legend.position = "none", axis.text.x = element_text( angle = 270))
p
#点图
p <- ggplot(data = workFrame, aes(x = bookName, y=Num)) + geom_point(aes(color=workplaceName))
p

条形图如下:
这里写图片描述
点图如下:
这里写图片描述

三、 对borrow13.txt进行处理

求出借书日期与还书日期:
#图书借阅时间
#借书时间
checkdate1 <-unique(borrow13$date_checkout)
head(checkdate)
## 使用substring来提取借书时间
checkdate2= substring(checkdate1,1,10)
#还书时间
duedate1 <-unique(borrow13$date_due)
head(duedate)
# 使用substring来提取还书时间
duedate2= substring(duedate1,1,10)
还书日期如下:

这里写图片描述

得到借书日期与还书信息,后续可以对借书天数进行处理。

  • 4
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值