R语言小白1天入门项目—K-means实战
· 写在前面
你好,初学R语言的各位,这也是我初学R语言的第一周,本人希望以后都能通过费曼学习法的输出即输入理论,来分享我的学习笔记从而巩固自己的知识体系。希望和各位小伙伴们一起互相督促,一起进步~
相比Python来说,刚接触R语言的我觉着R语言特别无脑,能用很短的代码实现一些数据操作,这对于新手真是太友好了!本次分享的项目是我的课程formative作业,感觉写完这一篇作业后对R语言有了很强的自信心,希望看到这篇文章的各位也是如此。
一、项目基础介绍
我们考虑了一个由𝑛=2500个水温(摄氏度)、水深(米)、盐度(实用盐度表,PSS)和氧含量(每升水的毫升数)测量值组成的海洋数据集。这里考虑的数据集是一个更大的数据集的一个子集,该数据集有近一百万个测量值,可从链接获取: 数据集。
二、读取数据
ocean <- read.table("http://www.maths.dur.ac.uk/~dma0je/Data/ocean.dat",header=TRUE, sep=",")
我们可以通过以下方法来查看前六行和数据维度S
dim(ocean)
head(ocean)
可以得到结果:
三、初步数据可视化
1.柱状图 hist
我们来进行一些简单的解释分析。四个相关变量的柱状图可以通过以下方式显示:
par(mfrow=c(2,2)) #输出2x2的图表形式
for (j in 1:4){
hist(ocean[,j], xlab=colnames(ocean)[j], main="")} #hist是柱状图,xlab是x的label,main=“” 表示没有标题
我们得到图表: