- 博客(25)
- 收藏
- 关注
原创 python main函数的意义及其常见写法
(1) main 函数的意义通俗的理解__name__ == ‘main’:假如你叫小明.py,在朋友眼中,你是小明(name == ‘小明’);在你自己眼中,你是你自己(name == ‘main’)。if name == 'main’的意思是:当.py文件被直接运行时,if name == 'main’之下的代码块将被运行;当.py文件以模块形式被导入时,if name == 'main’...
2019-05-11 05:31:25 9224 2
原创 python 命令行参数解析 optparse usage
This is a reference for optparseThe first part is sample codes and the second part is the specification of common parameter
2019-05-11 04:54:04 914
原创 如何查询相关基因及其相关的全部信息
https://www.genecards.org/cgi-bin/carddisp.pl在检索的过程中输入感兴趣的基因的缩写,即可出现与基因相关的很多信息
2019-01-23 21:02:03 2498
原创 cBioPortal数据库使用
cBioPortal数据介绍cBioPortal 提供了研究分析癌症基因数据的可视化工具,帮助癌症组织和细胞学研究得到的分子学数据认识。cBioPortal 提供了研究分析癌症基因数据的可视化工具,帮助癌症组织和细胞学研究得到的分子学数据认识。cBioPortal 数据来源和分析选项来源于多个网站,TCGA(https://tcga-data.nci.nih.gov/tcga)、ICGC(h...
2019-01-23 16:01:55 16634 1
原创 查看感兴趣基因的表达量及其相关关系
问题来源:探寻:NCR2 表达对GBM肿瘤芯片数据中cell-cycle 和 cytokines 通路基因的相关关系通过KEGG.db 来下载KEGG相关通路的基因if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")BiocManager::install("KEG...
2019-01-22 19:48:21 3037
原创 KEGG 通路信息下载及其相关处理
KEGG数据下载打开kegg官网:http://www.genome.jp/kegg/catalog/org_list.html然后点击相应物种前面三个字母缩写位置进入下载界面:然后点击相应的格式进行下载,我们最常用的下载格式是htext下载到.keg 格式的文件我下载的是人的全部的KEGG文件,其文件名称为hsa00001.keg文件探索2.1 初步看看各种通路信息...
2019-01-21 10:30:28 10632 2
原创 Git
两种取得git项目仓库的方法,一种是在现有的目录下,导入所有文件来创建新的git仓库,第二种是从已有的git仓库克隆出一个新的镜像仓库来(在本地新建一个文件夹,在文件夹底下克隆)。取得项目的git仓库新建文件夹git initgit add filegit add filegit commit -m ‘initial project version’从现有仓库克隆git clone...
2019-01-15 23:32:50 160
原创 linux 环境变量的修改
linux全局变量的修改修改 /etc/profile 文件(需要root权限)(1) 查看当下PATH环境变量echo $PATH(2) vim /etc/profile在配置文件中加入一行export PATH=$PATH:/(软件的路径名)(3) source /etc/profile在不重启系统的情况下使得修改的内容生效linux 用户变量的修改2.1 临时...
2019-01-15 23:24:58 3315
原创 R 中 三个排序函数的区分
x <- c(4,6,2)1、 sort(x)是对向量x进行排序,返回值排序后的数值向量, 即(2,4,6)。2、 rank()是求秩的函数,它的返回值是这个向量中对应元素的“排名” (2,3,1)。3、 order()的返回值是对应“排名”的元素所在向量中的位置,即(3,1,2) 当然可以设定decreasing 来设置是从大到小还是从小到大,default是从小到大的顺序。...
2018-10-31 22:06:51 552
原创 linux 用find 和 rm进行批量删除
find ./ -name _NA | xargs rm -rf用 find 检索出相应文件(包括当下文件夹下面的文件也能一并检索出来), 然后将检索结果通过管道命令导向到参数 xargs 然后用rm命令进行删除, -rf为删除命令rm的参数, r表示递归删除,f表示不需要确认也可以不用管道find [目录名] -name “文件名” -exec rm -rf “{}” ;列如: fi...
2018-10-31 17:20:52 7625
原创 轮廓系数
轮廓系数如何计算(图像来源于百度)a(i) :i向量到同一簇内其他点不相似程度的平均值b(i) :i向量到其他簇的平均不相似程度的最小值通过图可以知道轮廓系数的如何计算可以用轮廓系数确定样本在聚类结果中的内聚度和分离度...
2018-10-22 19:02:37 5550
原创 R语言 list注意事项
如果列表中间的某一元素没有输入,则将该元素自动保存为NULLa <- NULLa[[1]] <- matrix(1:12, ncol = 3)a[[3]] <- c("B","C","F")结果输出如下:a[[1]][,1] [,2] [,3][1,] 1 5 9[2,] 2 6 10[3,] 3 7 ...
2018-10-21 21:48:02 667
原创 R语言 集合运算
R语言中的集合运算A <- 1:10B <- 1:5C <- seq(2,8,2)#求A和B的交集union(A,B)#求A和B的并集intersect(A,B)#A-Bsetdiff(A,B)#B-Asetdiff(B,A)#判断A是否属于Ball(A%in%B)#判断B是否属于Aall(B%in%A)#判断集合A和B是否相同setequal(...
2018-10-21 20:08:52 3221 2
原创 R语言 ConsensusClusterPlus 确定最佳K值
用PCA的方法确定最佳聚类数M 为计算出共识矩阵Fn = ecdf(M[lower.tri(M)]) 提取出共识矩阵下三角的数据,然后将用ecdf 方法生成拟合曲线计算0.1到0.9之间的面积面积最小值对应K为最佳KKvec = 2:maxKx1 = 0.1; x2 = 0.9 # threshold defining the intermediate sub-intervalPAC...
2018-10-21 15:47:20 12218 4
原创 R语言 NMF 如何自动判断最佳rank的数目
文章目录1. 用NMF示例方法产生默认的判断rank数的图片2. 提取cophenetic 数据3. 实现自动判断最佳rank值1. 用NMF示例方法产生默认的判断rank数的图片library(NMF)data("esGolub")esGolub <- esGolub[1:200,]esGolub$Sample <- NULLestim.r <- nmf(esGol...
2018-10-20 16:35:56 8982 2
原创 R 生成列表的两种方式
第一种方法,直接用list() 函数生成列表#method onea <- "my first list"b <- 1:3c <- matrix(0, ncol=3,nrow=4)mylist <- list(name=a, other=b,c)第二种方法 先生成一个空文件,然后用[[i]] 生成列表,第二种方法在循环生成列表中用的很多a <-...
2018-10-19 16:05:59 11506
原创 R语言 try() 错误识别
1.将可能会报错的命令行放到try()函数中,并将其赋值到一个变量名fit(可以是任意变量名)中2.如果有错误,将fit将称为一个类型为“try-error”的变量3.可以用R 'try-error' %in% class(fit)放置在if()函数中进行判断4.try() 函数一般与next 和 break 进行联用,next跳过本次循环,break跳出循环 library(Conse...
2018-10-19 09:19:48 10546 1
原创 聚类树的切割方法
文章目录聚类树的切割方法在R语言中的实现静态切割比较简单,现在主要谈动态切割##dynamicTreeCut 函数包的使用这个包主要是探测层次聚类中的clusters2.1 执行动态切割比较重要的包(“cutreeDynamic”)input :clutering treedissimilarity matrix that was used to produce the ...
2018-10-15 23:09:40 3480
原创 R语言 Kmeans每次聚类结果不同的问题
问题阐述:同样的数据,同样的命令,重复运行命令时,发现每个cluster里面的个数都在变化问题原因:k-means算法中起点是随机或者认为给定的,如果初始类中心发生改变,可能会导致结果改变解决问题的方法:1、把初始随机数进行固定2、自己设定初始随机种子R语言中代码实现R里 kmeans(x, centers, iter.max = 10)可以通过centers 来进行调节R语言初始随...
2018-10-10 10:33:10 15110
原创 R语言—mcl运行错误记录
文章目录mcl $ operator is invalid for atomic vectorsmcl $ operator is invalid for atomic vectors问题阐释:在展示mcl运行结果mcl_result$Cluster时出现如下问题:$ operator is invalid for atomic vectors问题解决:先看看mcl函数mcl...
2018-10-04 21:52:31 4127
原创 R语言绘图1
文章目录R语言绘图1难点一:修改图像参数的两种方法难点二:如何将多条曲线画在一张图上难点三:给点添加文本标注难点四:如何将图片导出为不同格式R语言绘图1难点一:修改图像参数的两种方法#方法一:用par参数进行修改#par()将生成一个含有当前图像参数设置的列表#par(no.readonly = T)可以生成一个可以修改的当前参数列表#输入运行数据dose = c(20, 30, 4...
2018-10-04 13:40:41 2121
原创 Python web编程 基础知识及其举例
web编程基础知识HTML基础格式CSS基础格式理解HTML和CSS之间的关系如何打开电脑开发者工具如何找到HTML对应的网页的感兴趣的信息Python任务举例:HTML基础格式HTML文件以开头,以结束。head部分,HTML的头部,定义网页的标题及其他的一些属性。body是网页的核心内容部分所以格式大纲为: CSS基础格式selector {property: v...
2018-10-03 21:20:55 383
原创 WeightedCuster R package的使用
WeightedCLuster R package的使用手册1. 本函数包的主要用途权重数据的聚类(主要是state sequences and weighted data) 和聚类结果的评估2.函数的安装install.packages(&amp;quot;WeightedCluster&amp;quot;)library(WeightedCluster)3.数据的输入和计算导入mvad数据,mvad 数据追踪了7...
2018-09-29 19:26:48 580
原创 R语言传参
如何在R语言传参在windows中运行R语言传参第一步:更改bash运行环境在Rscript.exe 所在的文件夹第二步:编写R语言测试代码第三步:将测试的R语言代码放到Rscript.exe所在的目录进行测试在windows中运行R语言传参这篇文章主要展示如何在windows bash环境中运行R语言代码,并且测试参数传递第一步:更改bash运行环境在Rscript.exe 所在的文件夹...
2018-09-28 21:10:11 2556
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人