一、读取txt
data_all=read.table(file='C:/Users/wenxiaoyu_intern/Desktop/所有周销量.txt',row.names=1,header=T,sep="\t")
二、数据分布
浅看一下数据分布和销量字段的标准差
summary(data_all)
sd(data_all$整体销量)
三、相关性分析
浅分析一下相关性
library("corrplot")
result=cor(data_all)
corrplot(result,method='pie',type="upper",col=col(10),tl.pos="d")
四、贝叶斯网络
浅分析一下贝叶斯网络
library(bnlearn)
bn.gs = gs(data_all)
bn.gs
plot(bn.gs)
报错:
Error in data.type(x) :
variable 新增定投数 is not supported in bnlearn (type: integer).
解决方案:excel里数据格式设置为科学计数法,一般人我可不告诉他
五、相关关系图之数据分布
data_pos=read.table(file='C:/Users/wenxiaoyu_intern/Desktop/所有周销量-正相关.txt',row.names=1,header=T,sep="\t")
library(GGally)
p=ggpairs(data_pos)
ggpairs(data_pos)
ggsave(filename='1.pdf',p,width=35,height=35)
就不附图啦,宝儿们快自己试试吧
这个系列,暂时就结束啦
准备用python再实现一次相关性,下次一定哦
附上系列文章
R语言数据分析之一-《R语言下载及读取excel导入excel》