0. 一些资料和balderdash
(14条消息) 练习1 R语言绘图简单训练_语言初级画图练习_一位统计路上的小学生的博客-CSDN博客
(14条消息) 一位统计路上的小学生的博客_CSDN博客-领域博主
目前来说感觉跟python差不太多(?)
简单的变量相关
先看下左下console和右上environment清空没,
清空以后开始玩耍!
定义变量
> a = "hello world"
> print(a)
[1] "hello world"
> b <- c(1,2,3) #c(1,2,3) -> b也行
> print(b)
[1] 1 2 3
此时右上角会有变量表格。
数一下有哪些变量
> print(ls())
[1] "a" "b"
拼接
> c = cat(a,b)
hello world 1 2 3
应付一下面试
读取文件
打开1.csv这个文件:
data <- read.csv("1.csv",encoding="UTF-8")
打开了会有表格出现
如果打不开,可以看下:
保存时候的R版本是不是比现在读取用的先进。。。
以及用记事本打开,在另存为里面改一下编码:
检查一下读取到的是不是数据框,TRUE代表对了!
> print(is.data.frame(data))
[1] TRUE
查找数据
特定值
subset()函数
从读取到的data中,查找“count”是786的数据,定义为a:
> a = subset(data, count == 786)
> print(a)
word count sort
7 感觉 786 音质
2. 最大最小值
max()
max(data$count):读取到的data下面的count值最大的是?
> b = max(data$count)
> c = min(data$count)
> print(b)
[1] 2360
> print(c)
[1] 106
3. 根据条件查找(混合形态!)
还是用subset()函数,各个条件之间用&隔开:
> d = subset(data, count>1000 & sort=="其他")
> print(d)
word count sort
2 耳机 1788 其他
3 不错 1319 其他
这里涉及到一个问题:如果条件是“sort不等于’其他‘”怎么办?
——教程里找一下判断语句相关~R CSV 文件 | 菜鸟教程 (runoob.com)
4. 画图!
先在R里面下载一个ggplot,教程很简单
ggplot2安装 - 简书 (jianshu.com)
默认先x后y。
ggplot函数的几个要素:
1、数据:mpg
2、图形属性映射:displ对应x轴,hwy对应y轴
3、几何对象:散点图
ggplot(data,aes(x=sort, y=count))+geom_point()
不多说了,直接上丑丑的实例:
ggplot(data,aes(x=word, y=count, colour=sort))+geom_point()
太多点了,切割一下(意思是按sort分类成很多个小图):
ggplot(data,aes(x=word, y=count, colour=sort))+geom_point()+facet_wrap(~sort)
丑图,但是差不多是这个意思(?)