![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生信
Nolan777
这个作者很懒,什么都没留下…
展开
-
SAM格式
标头注释部分标头信息可有可无,都是以@开头,用不同的tag表示不同的信息,主要有:@HD,说明符合标准的版本、对比序列的排列顺序(这里unsorted)@SQ,参考序列说明 (SN:gi|10141003|gb|AF086833.2|)@PG,使用的比对程序说明(这里是bowtie2)LN 是参考序列的长度比对结果部分第一列: Query Name (QNAME)一列代表着比对片段的(template)的编号如 SRR957678.4325620第二列:FLAG在 SAM 格式中,原创 2021-04-17 21:20:03 · 345 阅读 · 0 评论 -
热图中的层次聚类
首先明白相关系数这个东西相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。定义式其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差**协方差(Covariance)**中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同不是概率分布时协方差公式:.原创 2021-04-16 22:06:30 · 8743 阅读 · 0 评论 -
rnaseq
ls ../sra/* |while read id; do (fastq-dump --gzip --split-3 -O ./ $id &);done**sra转fq --split-3**加上--split-3之后, 会把原来双端拆分成两个文件,但是原来单端并不会保存成两个文件. --gzip就能输出gz格式。原创 2021-03-24 09:31:16 · 258 阅读 · 1 评论 -
一些疑难杂点记录
测序时dna片段结构一般是ad1-index-fragment-ad2其中ad2与flowcell上固定的短序列通过一种特殊化学键相连桥式PCR扩增之后开始测序添加的引物时与index互补的所以测序所得结果一般是index-fragment-ad2或者index-部分fragment所以 ad2 只能再3端...原创 2021-03-21 15:24:59 · 117 阅读 · 0 评论 -
测序原理一些知识点
详细链接 https://zhuanlan.zhihu.com/p/20702684转载 2021-03-19 21:39:42 · 322 阅读 · 0 评论