cars=read.csv("/cars.txt",stringsAsFactors=TRUE)路径换成自己的路劲
这样子 就可以得到了原始的数据了 可以对原始的数据进行处理和操作
hist(cars2$weightlbs,breaks=30,xlim=c(0,5000))
plot(cars2$weightlbs,cars2$mpg)
画图他的直方图
qqnorm(cars$weightlbs,
datax = TRUE,
col = "red",
#ylim = c(0.6931, 4.7875),
#main = "对数变换后的dist的Q-Q图"
) #画QQ图
qqline(cars$weightlbs,
col = "blue",
datax = TRUE)#画对比直线
如果这个图蓝色的直线可以看到是直线 说明原始的数据是趋近正态分布的
cars_z$mpg[which(abs(cars_z$mpg)>2.9)]
cars$mpg[2]=70
boxplot(cars$mpg)
stat1=boxplot(cars$mpg)
画出箱子图
可以看出圆圈属于离群点