自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 SAM格式

标头注释部分标头信息可有可无,都是以@开头,用不同的tag表示不同的信息,主要有:@HD,说明符合标准的版本、对比序列的排列顺序(这里unsorted)@SQ,参考序列说明 (SN:gi|10141003|gb|AF086833.2|)@PG,使用的比对程序说明(这里是bowtie2)LN 是参考序列的长度比对结果部分第一列: Query Name (QNAME)一列代表着比对片段的(template)的编号如 SRR957678.4325620第二列:FLAG在 SAM 格式中,

2021-04-17 21:20:03 315

原创 热图中的层次聚类

首先明白相关系数这个东西相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量简单相关系数:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。定义式其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差**协方差(Covariance)**中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同不是概率分布时协方差公式:.

2021-04-16 22:06:30 8448

原创 FDR

FDR(false discovery rate),是统计学中常见的一个名词,翻译为伪发现率,其意义为是 错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值。即错误拒绝真/拒绝总数FDR(false discovery rate),是统计学中常见的一个名词,翻译为伪发现率,其意义为是 错误拒绝(拒绝真的(原)假设)的个数占所有被拒绝的原假设个数的比例的期望值。统计学中的假设检验的基本思路是:设立零假设(null hypothesis)H0,以及与零假设 相对应的非零假设(al

2021-04-15 20:40:37 6585

原创 linux练习

root@PC-jj:/mnt/e/练习# cat test\(1\).bed | tr "M" "\t" |tr "N" "\t" |awk '{print $9}' |paste -s -d +|tr "+" "\n" |grep "^1" |paste -s -d + |bc >1root@PC-jj:/mnt/e/练习# cat test\(1\).bed | tr "M" "\t" |tr "N" "\t" |awk '{print $7}' |paste -s -d + |bc >

2021-04-07 20:26:28 109

原创 rnaseq

ls ../sra/* |while read id; do (fastq-dump --gzip --split-3 -O ./ $id &);done**sra转fq --split-3**加上--split-3之后, 会把原来双端拆分成两个文件,但是原来单端并不会保存成两个文件. --gzip就能输出gz格式。

2021-03-24 09:31:16 246 1

原创 一些疑难杂点记录

测序时dna片段结构一般是ad1-index-fragment-ad2其中ad2与flowcell上固定的短序列通过一种特殊化学键相连桥式PCR扩增之后开始测序添加的引物时与index互补的所以测序所得结果一般是index-fragment-ad2或者index-部分fragment所以 ad2 只能再3端...

2021-03-21 15:24:59 112

转载 测序原理一些知识点

详细链接 https://zhuanlan.zhihu.com/p/20702684

2021-03-19 21:39:42 313

原创 linux处理fq文件练习

1.获得第二行perl -alne '{print if $.%4==2}' reads_1.fq |less -SN在这里插入代码片##$.代表行2.每一行长度perl -alne '{print length}' reads_1.fq |less -SN

2021-03-19 17:30:15 644

原创 Linux练习-gff

1. 查看gff文件Y染色体基因数目ensemble下载y然染色体gff注释文件zcat Homo_sapiens.GRCh38.103.chromosome.Y.gff3.gz | grep -v “#” | cut -f 3 | grep “^gene” | sort |uniq -c2.第三列类几种zcat Homo_sapiens.GRCh38.103.chromosome.Y.gff3.gz | grep -v “#” | cut -f 3 | sort | uniq -c | sort

2021-03-16 17:17:30 586

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除