数据文件nc6oa.txt由33个癌细胞系得6830个基因表达数据构成,每一个细胞系都是某种类型的癌细胞的类型。请按照基因表达数据对33个细胞系进行聚类(聚类类别数划是癌细胞的类型个数,比如乳腺癌、肺癌、肾癌、结肠癌、白血病、卵巣癌等等),并请说明为什么聚成这些类别?(自己新建Word文档,先写程序及程序的结果,分析结果,最后以附件的形式上传word文档
data <- read.table("nci604.txt")
由于列比较多,有6830个,因此建议第一步做PCA降维处理
pca1<-prcomp(as.matrix