自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (2)
  • 收藏
  • 关注

原创 R 循环中将变量作为对象名

for (i in c(“tmp1”, “tmp2”, “tmp3”)) {print(i)}[1] “tmp1”[1] “tmp2”[1] “tmp3”for (i in c(“tmp1”, “tmp2”, “tmp3”)) {print(get(i))}[1] 0 0 0 0 0 0 0 0 0 0[1] 0 0 0 0 0 0 0 0 0 0[1] 0 0 0 0 0 0 0 0 0 0但是get(i)[2] = 1 时报错Error in get(i)[1.

2021-03-12 22:30:56 868

原创 ens2sym <- select(org.Hs.eg.db, keys=row.names(pc9_removebatch_b12),columns=c(“ENTREZID“,“SYMBOL“),

想要基因ID转换,用select函数时报错,ens2sym <- select(org.Hs.eg.db, keys=row.names(pc9_removebatch_b12),columns=c(“ENTREZID”,“SYMBOL”), keytype=“ENSEMBL” )Error in UseMethod(“select_”) :"select_"没有适用于"c(‘OrgDb’, ‘AnnotationDb’, ‘envRefClass’, ‘.environment’, ‘refCl

2020-09-15 19:45:39 1862

原创 R输出当前绘图窗口的图片,字符串作为变量引用,折线图,修改坐标刻度名称

如输出pngpng(filename=" ", …)dev.off()字符串作为变量引用:如abc和gfrt为变量名for (i in c(“abc”,“gfrt”)){get(i)[1,2]}

2020-08-23 16:41:42 489

原创 Error in .jcall(“RJavaTools“, “Ljava/lang/Object;“, “invokeMethod“, cl, : java.lang.OutOfMemoryE

R语言"xlsx"包读取xlsx很大的文件,报错Error in .jcall(“RJavaTools”, “Ljava/lang/Object;”, “invokeMethod”, cl, :java.lang.OutOfMemoryError: Java heap space使用“readxl"包即可

2020-08-21 16:59:48 3426

原创 生信文献阅读-netNMF-sc 在单细胞测序数据降维和聚类中保留基因间的相互关联信息

原文献:netNMF-sc: Leveraging gene-gene interactions for imputation anddimensionality reduction in single-cell expression analysis简要的说就是用非负矩阵分解,在聚类时对原始的基因相关性保留的比较好。同时间另一篇文献的目标差不多,只是用的是Random projection:SHARP: Hyper-fast and accurate processing of single-cel

2020-07-27 17:10:54 1330

原创 R语言获得多个向量中每个元素出现的次数

将多个向量用list()函数组合为,如list1,然后aaa <- table(unlist(list1))sum(aaa == 1)

2020-07-09 09:38:42 12052

原创 R中查找某个向量中元素在另一个向量中的位置

取了向量交集之后,想要找到子集在之前的向量中的位置,进行筛选使用match函数,match(x,y),返回x在y中的位置。

2020-07-05 13:53:37 7136

原创 ANNOVAR使用笔记-过流程

gatk的germline mutation call完之后,得到VQSR过滤之后的VCF文件,之前使用了gvcf模式,这里是多个样本合并起来的的文件。首先官网下载ANNOVAR软件,需要注册。官网地址解压后里面有很多.pl文件,这些是用perl写的脚本,可以直接运行,类似于:perl table_annovar.pl +参数初级主要用到的有annotate.pl 下载数据库,注释数据convert2annovar.pl 将变异文件转化annovar可以使用的文件格式annotate_vari

2020-07-04 13:35:16 2192 1

原创 vim ctrl+s 之后无法输入解决

今天和同学说话的时候一不留神,在vim里按了ctrl+s,结果无法输入了,去网上看了一下,vim的ctrl + s是阻止之后的输入,只要按ctrl + p即可。

2020-07-03 21:34:34 496

原创 Germline mutation annovar注释后的结果之后的分析

2020/7/2遵循GATK的germline mutation 流程,得到vcf文件后,用annovar软件给予注释,其中multianno.txt文件是最终得到的多种突变的注释文件。可以导入Rstuodio进行分析。读取时,分隔符为 \t 。随项目进展更新。...

2020-07-02 22:15:37 3798

原创 转录组和蛋白质组结合分析-入门笔记

2020/7/2为了防止自己每天学了就忘,记录笔记。1.因为翻译调控的存在,转录组和蛋白组之间存在不一致。2.常见的是算出转录组的差异转录基因和蛋白组的差异表达蛋白,分别作为横纵坐标,可以画九象限图。展示。3.蛋白质组可以用msmsTests包来分析。先写这些,以后补充。...

2020-07-02 21:51:24 3753

原创 Rstudio xlsx包读取xlsx报错 Error in .jcall(cell, “D“, “getNumericCellValue“) : java.lang.OutOfMemoryEr

Rstudio xlsx包读取xlsx报错 Error in .jcall(cell, “D”, “getNumericCellValue”) : java.lang.OutOfMemoryError: GC overhead limit exceeded换readxl包即可。

2020-07-02 18:55:45 1319

原创 R 中data.frame提取其中某一部分,转变为vector,生成1,1,1,2,2,2这样的向量

as.numeric()即可

2019-11-20 19:52:37 2304

原创 R 语言中在列表/向量的最后添加元素

R 语言中在列表/向量的最后添加元素:append 函数x <- c(1,2,3)x <- append(x,3)

2019-11-20 19:39:48 29489 4

转载 R语言因子理解,转自知乎,mark一下

原文链接:如何理解R中因子(factor)的概念?作者:Sanyo链接:https://www.zhihu.com/question/48472404/answer/455193433来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。一、定义标准定义: 因子用来存储类别变量和有序变量,这类变量不能用来计算而只能用来分类或者计数。举个例子来看。我们在取用数据的...

2019-09-06 11:09:42 852

原创 超级菜鸟-trim_galore linux 下载解压后,在trim_galore前加上perl即可使用

超级菜鸟-trim_galore linux 下载解压后,在trim_galore前加上perl即可使用欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Mark...

2019-04-01 16:30:50 1100

原创 转行生物信息学啦,求帮助指导入门!

转行生物信息学啦,求帮助指导入门!本人生物大四学生,保研生化细胞所,不喜欢做实验,经过大概两个月的思考,最终决定转行生信。老师给的建议是先读两本生信概论书籍,了解个大概,希望各位师兄师姐能够给点建议,推荐几本比较好的生信入门书籍。谢谢啦!!!...

2019-02-26 16:30:31 1567 1

特征选择MCFS算法,来自github

n many data analysis tasks, one is often confronted with very high dimensional data. Feature selection techniques are designed to find the relevant feature subset of the original features which can facilitate clustering, classification and retrieval. The feature selection problem is essentially a combinatorial optimization problem which is computationally expensive. Traditional feature selection methods address this issue by selecting the top ranked features based on certain scores computed independently for each feature. These approaches neglect the possible correlation between different features and thus can not produce an optimal feature subset. Inspired from the recent developments on manifold learning and L1-regularized models for subset selection, we propose here a new approach, called {\em Multi-Cluster/Class Feature Selection} (MCFS), for feature selection. Specifically, we select those features such that the multi-cluster/class structure of the data can be best preserved. The corresponding optimization problem can be efficiently solved since it only involves a sparse eigen-problem and a L1-regularized least squares problem. It is important to note that MCFS can be applied in superised, unsupervised and semi-supervised cases. If you find these algoirthms useful, we appreciate it very much if you can cite our following works: Papers Deng Cai, Chiyuan Zhang, Xiaofei He, "Unsupervised Feature Selection for Multi-cluster Data", 16th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD'10), July 2010. Bibtex source Xiaofei He, Deng Cai, and Partha Niyogi, "Laplacian Score for Feature Selection", Advances in Neural Information Processing Systems 18 (NIPS'05), Vancouver, Canada, 2005 Bibtex source

2019-03-22

特征选择算法函数库-matlab

本资源是matlab特征选择的特征选择函数库,包含大量的特征选择所需的源码,包括 relieff, ILFS等,需要的可以下载,此版本带有license。

2019-03-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除