- 博客(5)
- 资源 (10)
- 收藏
- 关注
原创 降维 PCA MDS Isomap
此图引自 几种降维思想方法总结PCA 为线性降维,MDS 及 Isomap非线性降维。PCA主要思想是去掉线性相关的影响。原数据定了,降维得的维数也就定了,可以通过选择数据的损失程度来确定维数。MDS与Isomap Isomap是MDS的改进,MDS只要满足原维上和降维后的数据欧氏距离相等即可,Isomap是先通过KNN筛选,再进行MDS,所以Isomap有可能出现断路现象...
2018-05-02 11:58:13 1133
原创 最新TCGA数据下载与整理
以TCGA-BRCA下载为例最先关联一下这哥们的总结,感觉挺到位。http://www.bioinfo-scrounger.com/archives/317本人尝试了用最原始的方法下载,速度稳定,下载也快,但需要整理的地方很多,首先是文件与样本id的匹配,再一个就是数据提取与标准化。最终整合到一个文件中。如果用 简易TCGA下载工具V2 下载,会出现下载过程卡顿现象,但可以续点下载。两种方法下...
2018-05-02 11:45:59 13289 1
原创 R读取TXT文件时,文件列名有重复,无法读取为data.frame格式的问题
这种方法比较麻烦,也有一定的修改mutidata2<-read.table("COLON_Methy_Expression.txt",header = FALSE)mutidata2 <- mutidata2[!duplicated(mutidata2[,1]), ]data2<-mutidata2[-1,-1]rownames(data2)<-mutidata2[1,-1...
2018-04-17 17:25:12 9401
原创 各种假设检验用法汇总
今天看了一天的各类检验的区别,主要是自己会用到的T检验 Z检验 F检验 卡方检验 Fisher精确检验得出以下结论(部分网上摘抄),不知道对错,请各位指教:T检验与Z检验T检验基本概念:(以上来自道客吧吧,t检验计算公式)上式中,其实已经包括了Z检验。T检验:主要用于总体样本未知,且样本容量小于30,Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的...
2018-03-13 08:55:45 10853 1
dependency.rar
2020-04-13
C# 读取一个文件夹中多个txt,去重正则化后重新写入,要求每个不能超过二十万行
2020-02-08
python爬取ajax网页,用json形式获取数据,并存入excel中
2019-04-17
题库与试卷生成系统Debug2.0版
2018-07-27
试卷生成系统优化C#版
2018-07-17
win10 64位,用VS2010编写的代码无法导出32位office方法
2018-07-12
《组合数学(原书第5版)》.((美)Richard A.Brualdi
2017-09-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人