- 博客(13)
- 收藏
- 关注
原创 Scala之字符【二】
本系列的全部内容来源于《Scala编程实战》一书。这个系列仅仅将书中对自己工作有用的代码进行了记录,以方便不时之需时进行查询。 package Strings/*Calculate the Adler-32 checksum using Scala */object adl32 { val MOD_ADLER :Int = 65521; def adler3...
2018-10-11 22:18:05
503
原创 Scala之字符串【一】
本系列的全部内容来源于《Scala编程实战》一书。这个系列仅仅将书中对自己工作有用的代码进行了记录,以方便不时之需时进行查询。package Stringsobject example_1 extends App { println("Hello World"); println("Hello World".getClass.getSimpleName());...
2018-10-11 21:08:27
1795
原创 Pandas选择数据
Pandas是一个非常好用的工具,可以用来处理各种格式的数据,例如过滤注释信息生成最终结果。此文仅仅是记录如何在Pandas中选择数据。当然,这仅仅是从网络上获取的一部分。侵联删。import pandas as pddata=pd.read_csv("detail.part.txt", sep="\t")data.head() code name ch...
2018-10-05 15:17:35
380
原创 vardict使用说明
vardict是由perl写的、用于检测NGS数据变异的一款软件。在命令行中输入perl vardict.pl 就可以看到vardict的帮助信息。如下图所示。 在帮助信息中简明扼要地说明了vardict的几个优点。这些不去理会它,更关心如何使用,需要设置哪些参数。首先,需要设置参考基因组,这里选用hg38参考基因组。其次,需要设置样本名称。然后,设置等位基因频率阈值和待
2017-02-04 14:29:42
6664
原创 [samtools]depth命令简介
samtools depth命令简介 depth命令计算每一个位点或者区域的测序深度并在标准显示设备中显示。使用此命令之前必须先index。 命令格式: samtools depth [options] [in1.bam|in1.sam|in1.cram[in2.bam|in2.sam|in2.cram]…] 参数:
2016-12-08 00:23:15
28854
原创 [samtools]flagstat命令简介
samtools flagstat命令简介: 统计输入文件的相关数据并将这些数据输出至屏幕显示。每一项统计数据都由两部分组成,分别是QC pass和QC failed,表示通过QC的reads数据量和未通过QC的reads数量。以“PASS + FAILED”格式显示。还可以根据samtools的标志位显示相应的内容,但是这里不做讨论。 命令格式:
2016-11-29 23:42:48
27544
7
原创 [samtools] idxstats bedcov faidx命令简介
samtools idxstats命令功能简介: 检索和打印已建立索引的bam文件的统计数据,包括参考序列名称、序列长度、比对上的read数量和未比对上的read数量。输出结果显示在屏幕上,以制表符分割。 命令格式: samtools idxstats 如下图所示: samtools bedcov命令
2016-11-27 23:13:40
6665
原创 [samtools]mpileup命令简介
samtools的mpileup命令是一个samtools中一个很重要的命令。它的主要功能主要是生成BCF、VCF文件或者pileup一个或多个bam文件。比对记录以在@RG中的样本名作为区分标识符。如果样本标识符缺失,那么每一个输入文件则视为一个样本。 在pileup格式中(没有-u或者-g参数),每一行代表基因组的位置,由染色体名、1个碱基坐标、参考碱基、reads覆盖该位点的
2016-11-22 23:19:55
33110
3
原创 [samtools]merge命令简介
samtools merge命令的功能描述: 当有多个样本的bam文件时,可以使用samtools的merge命令将这些bam文件进行合并为一个bam文件。Merge命令将多个已经排序后的bam文件合并成为一个排序的且保持所有输入记录并保持现有排序顺序的bam文件。 若使用-h参数,则将输入文件的@SQ文件头合并到指定的文件头中。否则,所有的文件头都被合并。
2016-11-20 16:41:24
32208
原创 [samtools]index命令简介
samtools index命令的功能描述: 为了能够快速访问bam文件,可以为已经基于坐标排序后bam或者cram的文件创建索引,生成以.bai或者.crai为后缀的索引文件。必须使用排序后的文件,否则可能会报错。另外,不能对sam文件使用此命令。如果想对sam文件建立索引,那么可以使用tabix命令创建。在使用与region参数相关的其它samtools命令时,需要创建索
2016-11-16 22:50:34
35373
2
原创 [samtools]sort命令简介
samtools sort命令的功能描述: 对bam文件进行排序,不能对sam文件进行排序。以leftmost coordinates的方式对比对结果进行排序,或者使用-n参数以read名称进行排序。将会添加适当的@HD-SO排序顺序标头标签或者如果有必要的话,将会更新现存的一个排序顺序标头标签。sort命令的输出默认是标准输出写入,或者使用-o参数时,指定bam文件输出名。so
2016-11-15 23:20:42
56460
原创 [samtools]view命令简介
Samtools,虽然叫做samtools,但是其在人重分析中操作的对象主要是BAM文件,有点名不副实啊。现在每天记录一点samtools的命令。samtools view [options] in.sam | in.bam | in.cram [region...]这条命令将输入文件转换成输出文件,如果没有指定option和region选项,则会在屏幕中显示sam格式的文件。在没有指
2016-11-11 20:51:05
39660
原创 BWA MEM比对人类参考基因组详解
在获得下机数据后,做的第一步是质控。质控工具有很多,这里就不做一一介绍了。这里讲如何使用BWA MEM将质控合格的数据比对到参考基因组上。 BWA是一款基于BWT的快速比对工具,其由三个算法组成。这三个算法分别是:BWA backtrack, BWA SW and BWA MEM。其中,BWA MEM是最新的,其更快更准确,更适合用于人重数据分析。对于上述三种算法,首先需要使用索
2016-11-10 20:37:56
38753
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人