- 博客(30)
- 收藏
- 关注
转载 UCSC 工具链接
http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/转载于:https://www.cnblogs.com/Demo1589/p/9911569.html
2018-11-05 21:09:00 611
转载 含有分类变量(categorical variable)的逻辑回归(logistic regression)中虚拟变量(哑变量,dummy variable)的理解...
使用R语言做逻辑回归的时候,当自变量中有分类变量(大于两个)的时候,对于回归模型的结果有一点困惑,搜索相关知识发现不少人也有相同的疑问,通过查阅资料这里给出自己的理解。 首先看一个实例(数据下载自:http://freakonometrics.free.fr/db.txt)> db <- read.table("db.txt",header=TRUE,sep...
2018-04-30 15:21:00 10831
转载 Rstudio-server 重新登录载入session的问题
Rstudio-server 非常好用,但是免费版的也有一些问题,一个是只能支持在一个客户端的登录,另一个就是每次登录都要导入之前session的问题,对于第二个问题的解决方案,我们可以进入到~/.rstudio文件夹,然后删除suspended session文件夹,再重新登录就好。转载于:https://www.cnblogs.com/Demo1589/p/8477260.h...
2018-02-27 09:57:00 2508
转载 DOS/Windows 文本格式与 Unix 文本各式转换
命令简介:dos2unix是将Windows格式文件转换为Unix、Linux格式的实用命令。Windows格式文件的换行符为\r\n ,而Unix&Linux文件的换行符为\n. dos2unix命令其实就是将文件中的\r\n 转换为\n。而unix2dos则是和dos2unix互为孪生的一个命令,它是将Linux&Unix格式文件转换为Windows格式文件的...
2018-02-25 13:43:00 621
转载 生存曲线绘制(转载)
http://user.ipathology.cn/26090/blog/7201.html转载于:https://www.cnblogs.com/Demo1589/p/8202821.html
2018-01-05 10:25:00 331
转载 R语言使用 multicore 包进行并行计算
R语言是单线程的,如果数据量比较大的情况下最好用并行计算来处理数据,这样会获得运行速度倍数的提升。这里介绍一个基于Unix系统的并行程序包:multicore. 我们用三种不同的方式来进行一个简单的数据处理: 我们从 1000 genome project 数据库下载了VCF文件,现在需要手动提取出每个allele的 allele frequency(AF)值(vcfto...
2017-12-20 19:37:00 1334
转载 关于 minor allele frequency(次等位基因频率)的理解
引用自NCBI的概念(https://www.ncbi.nlm.nih.gov/projects/SNP/docs/rs_attributes.html#gmaf) Global minor allele frequency (MAF): dbSNP is reporting the minor allele frequency for each rs included in...
2017-12-19 19:23:00 5811
转载 关于Allele(等位基因)的理解
高中学生物的时候关于遗传学的部分,记得当时的教材上为了简化处理一般将基因型定义为AA, Aa, aa。其实这种抽象的理解对应付高考是很有用的,但是实际应用中如果还这样理解那么便会产生一些疑问。之所以会产生这样的抽象,原因是早期并不知道双螺旋DNA是遗传物质,就更不提什么中心法则和DNA测序了。然而当时非常有慧根的孟德尔先生他通过豌豆杂交实验发现了著名的孟德尔遗传定律。所以当早期人们对...
2017-12-19 15:46:00 1996
转载 beta 分布的详细介绍(转载)
目前看到的关于beta分布最好的一个解释,由于贴过来格式不好看,所以附上链接: http://www.datalearner.com/blog/1051505532393058转载于:https://www.cnblogs.com/Demo1589/p/7932539.html...
2017-11-30 23:33:00 168
转载 ucsc 文件格式说明
链接附带的是ucsc各种格式文件的说明,以后遇到新类型的文件可以先来这里看看!https://www.genome.ucsc.edu/FAQ/FAQformat.html转载于:https://www.cnblogs.com/Demo1589/p/7889339.html...
2017-11-24 10:25:00 378
转载 matlab sparse函数和full函数用法详解(转)
sparse函数功能:Create sparse matrix-创建稀疏矩阵用法1:S=sparse(X)——将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩阵S。如果X本身是稀疏的,sparse(X)返回S。例如:A= 0 2 0 4 0 6 7 0 ...
2017-11-22 22:51:00 3579
转载 popen() 使用举例 (转载)
函数原型: #include “stdio.h” FILE *popen( const char* command, const char* mode ) 参数说明: command: 是一个指向以 NULL 结束的 shell 命令字符串的指针。这行命令将被传到 bin/sh 并使用 -c 标志,shell 将执行这个命令。 mode: 只能是读或者写中的...
2017-11-16 18:07:00 6598
转载 C语言中file文件指针概念及其操作 (转载)
文件 文件的基本概念 所谓“文件”是指一组相关数据的有序集合。 这个数据集有一个名称,叫做文件名。实际上在前面的各章中我们已经多次使用了文件,例如源程序文件、目标文件、可执行文件、库文件 (头文件)等。文件通常是驻留在外部介质(如磁盘等)上的,在使用时才调入内存中来。从不同的角度可对文件作不同的分类。从用户的角度看,文件可分为普通文件和设备文件两种。 普通...
2017-11-16 16:42:00 7129
转载 C stat函数的用法举例(转载)
stat函数讲解表头文件: #include <sys/stat.h> #include <unistd.h>定义函数: int stat(const char *file_name, struct stat *buf);函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体stat中返回值:...
2017-11-16 16:30:00 1170
转载 利用JAVA多线程来提高数据处理效率
肿瘤大数据挖掘中经常需要处理上百亿行的文本文件,这些文件往往高达数百GB,假如文件结构简单统一,那么用sed和awk 处理是非常方便和快速的。但有时候会遇到逻辑较为复杂的处理流程,这样我一般会用JAVA来处理。但由于JAVA是单线程的,因此对于实验室多核服务器来说,能充分有效的利用起每个核会方便不少,那么这个时候就推荐用多线程来并发(并行)处理任务,从而达到运算速度倍速的提升。 ...
2017-10-26 11:16:00 1227
转载 矢量图素材网站
生信文章里面图片很多都是基于插画性质的质量图,最近写文章苦于找不到合适的素材,今天发现一个网站还不错,这里帖网址:http://www.zcool.com.cn/ http://ibaotu.com/转载于:https://www.cnblogs.com/Demo1589/p/7609608.html...
2017-09-29 09:43:00 116
转载 qPCR检测基因表达的引物数据库
老板推荐了一个专门用来做基因表达定量(qPCR)的引物数据库,还蛮好用的,都是别人实验验证过的,感觉比自己设计的更靠谱一下,附上链接:https://pga.mgh.harvard.edu/primerbank/转载于:https://www.cnblogs.com/Demo1589/p/7603801.html...
2017-09-27 20:47:00 1250
转载 UCSC下载ENCODE数据
ENCODE数据库用于存放基因组原件,所有的测序数据(原始数据以及每一步处理后的数据以及最终的结果)都是开放下载的。假如说去官网下载的话会比较麻烦,这里可以通过UCSC的数据库下载(真的是神器啊)!下面介绍方法: https://www.genome.ucsc.edu/ENCODE/downloads.html直接在这个网址里面下载就可以了,里面有hg19版本的说...
2017-09-21 12:03:00 776
转载 JAVA中接口的使用
抽象类是从多个类中抽象出来的模板,如果将这种抽象进行的更彻底,那么就是接口(interface)了。什么是接口,简单的讲,接口就是抽象类的进一步抽象,这种进一步的抽象只定义了一种规范,而不需要关心具体的数据状态和方法实现细节,它只规定了一部分必须提供的方法。下面介绍接口的具体使用细节; 1.接口里不能包含构造器和初始化块定义,只能包含成员变量(静态常量)、方法(抽象实例方法、类...
2017-08-15 10:49:00 516
转载 JAVA中抽象类的使用
抽象类是从多个具体类中抽象出来的父类,它具有更高层次的抽象。抽象类体现的就是一种模板模式的设计,抽象父类可以只定义需要使用的某些方法,把不能实现的某些部分抽象成抽象方法,留给其子类去实现。具体来说,抽象类的使用有以下几点要注意: 1.抽象方法和抽象类必须使用abstract来修饰,其中抽象方法不能有方法体。 2.抽象类不能被实例化。 3.抽象类可以包含成员变量,方法...
2017-08-14 09:42:00 1325
转载 R语言中函数调试
有时候会用R语言写一下简单的脚本处理函数,加入需要调试的话可以按照下面的步骤进行:fun <- function(x , y){ x + y x - y x * y x / y}debug(fun) 先创建一个简单的函数,然后用debug() 函数对创建的fun()函数进行debug。这时控制台没有任何变化...
2017-07-05 10:28:00 611
转载 利用Bioperl的SeqIO模块解析fastq文件
测序数据中经常会接触到fastq格式的文件,比如说拿到fastq格式的原始数据后希望查看测序碱基的质量并去除低质量碱基。一般而言大家都是用现有的工具,比如说fastqc这个Java写的小程序,确实很好用,运行速度快,检查的项目也多。有时候我们也需要对这些数据进行个性化的分析,那么这个时候这些小工具就不能胜任了,需要我们自己写程序(脚本)来处理。本人目前才疏学浅,因此只有一下三种方案:...
2017-07-03 00:02:00 826
转载 ASCII码表
ASCII码表BinDecHex缩写/字符解释00000000000NUL(null)空字符00000001101SOH(start of headling)标题开始00000010202STX (start of text)正文开始000000113...
2017-07-02 23:20:00 135
转载 JAVA 中转义符的理解
生物信息中有时候会遇到JAVA写的程序,今天阅读源码的时候发现对于正则中的转义符不好理解,后来查资料后终于弄明白了,这里详细说明一下: 字符串的表示有三种方法:1、直接单字符,例如“A”;2、由转义字符表示的特殊字符,例如“\t”; 3、Unicode字符,例如“\u0008”。其中转义字符表示的字符串,显示出来的就是这种模式,例如“\t”与“ ”是同一个字符串,“abc\t...
2017-06-29 00:35:00 987
转载 在线引物设计网站,老板推荐的,亲测好用
直接上连接:http://primer3plus.com/cgi-bin/dev/primer3plus.cgi转载于:https://www.cnblogs.com/Demo1589/p/7042022.html
2017-06-17 23:55:00 2820
转载 列出一个买东西的好网站,值得推荐
十大品牌网,链接在这里,以后买各种东西都可以来这里查询一下!http://www.china-10.com/转载于:https://www.cnblogs.com/Demo1589/p/7041546.html
2017-06-17 22:20:00 120
转载 R语言集合操作
熟练运用R语言的集合操作在很多时候可以省去for循环,从而提升数据处理效率。废话不多说,集合操作相对简单,贴一段代码就懂了!> A<-1:10> A [1] 1 2 3 4 5 6 7 8 9 10> B<-seq(5,15,2)> B[1] 5 7 9 11 13 15> C<-...
2017-06-11 20:40:00 654
转载 R语言do.call 函数用法详解
虽然R语言有类型很丰富的数据结构,但是很多时候数据结构比较复杂,那么基本就会用到list这种结构的数据类型。但是list对象很难以文本的形式导出,因此需要一个函数能快速将复杂的list结构扁平化成dataframe。这里要介绍的就是do.call函数。 这里是do.call 函数的官方文档:do.call {base}R Documentation...
2017-06-11 10:58:00 2311
转载 关于bedtools merge 功能中sort 命令的解释
Bedtools 是一个很好的用来处理区间的工具,很多时候用这个底层语言编写的小工具比自己写的脚本运行快很多,但是这个工具中的某些功能对输入文件有一定的要求,比如说里面的一个merge函数,这是里面的一个note:Note:bedtools merge requires that you presort your data by chromosome and then b...
2017-06-08 15:06:00 1755
转载 关于基因组注释文件GTF的解释
GTF文件的全称是gene transfer format,主要是对染色体上的基因进行标注。怎么理解呢,其实所谓的基因名,基因座等,都只是后来人们给一段DNA序列起的名字而已,还原到细胞中就是细胞核里面的一条长长的染色体(DNA序列)。而这个GTF文件的主要功能,就是指出我们所谓的基因在染色体上的位置(coordinate),并且还标注了这一段区间的其他信息。 GTF文件我一般...
2017-06-06 10:44:00 4272
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人