自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

转载 Extract lowercase masked FASTA from a BLAST database with masking information

If a BLAST database contains masking information, this can be extracted using the blastdbcmd options –db_mask and –mask_sequence as follows:$ blastdbcmd -info -db mask-data-dbDatabase: Mask data te

2015-10-17 09:46:40 650

原创 本地blast

目前本地blast的版本:下载:wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/解压:tar zxvpf ncbi-blast-2.2.31+-x64-linux.tar.gz之后生成一个文件夹:ncbi-blast-2.2.31+Under bash, the followi

2015-10-16 15:34:01 1044

原创 待整理

Seed-and-extend alignersAn alignment strategy that first builds a hash table containing the location of each k-mer (seed) within thereference genome. These algorithms then extend these seeds

2015-10-15 13:54:18 325

原创 edgeR(未完)

edgeR的安装:source("http://bioconductor.org/biocLite.R") biocLite("edgeR")查看R的当前工作目录:> getwd()[1] "D:/My Documents"载入包:library(limma)library(edgeR)读取数据:raw.data 查看数据

2015-10-14 16:00:01 2398

转载 质量值体系 Phred33 和 Phred 64 的由来 及其在质量控制中的实际影响

最近在学习质控知识时, 对于质量值体系及转换产生了一些疑问, 作了一些尝试, 趁集群故障, 在此总结一下质量值体系相比之前培训时所学的质控内容, (我拿到的) 流程中还多了一步 phred33to64, 也就是把 .fastq 格式的数据从 Phred33 质量值体系转换为 Phred64 质量体系, 于是先补充学习了下质量值体系:首先要从质量值说起, 测序仪器下机数

2015-10-07 14:36:54 8551

转载 VCFtools quality filtering

VCFtools provide a wide range of functionality for the filtering, analysis and transformation of vcf files. Typically, SNPs of quality < 20 and read depth < 20 are filtered out as they are considere

2015-10-07 14:15:06 826

原创 Read alignment后的质量控制

Drop low-quality alignments: Each alignment is given a quality score (MAPQ) which is equivalent to Phred scores (with respect to determining relative quality of different alignments). You can screen f

2015-10-07 13:46:42 870

原创 命令行整理

提取fastq文件中的一部分序列来进行测试:zcat ERR022075pe.fasta.gz | head ­1500000 > subset.fasta

2015-10-07 12:48:49 362

转载 Genome denovo assembly using velvet

Velvet is denovo assembler suitable for small genomes. It is based on deBruijn graph andwe must define kmer length when using it.In practice you should try several assemblies with different values

2015-10-07 12:43:35 367

原创 分子生物学上的生物定义整理

#经常遇到的问题是,很多时候一些看是简单的生物学小知识点,突然忘记什么意思,所以决定在这里记下学习过程中,遇到的一些小的知识点,以备方便查阅。############################寡核苷酸,是一类只有20个以下碱基的短链核苷酸的总称(包括脱氧核糖核酸DNA或核糖核酸RNA内的核苷酸),寡核苷酸可以很容易地和它们的互补对链接,所以常用来作为探针确定DNA或RNA的结

2015-10-07 09:41:47 522

原创 NGS library construction(未完待续)

基本原理:Fundamental to NGS library construction is the preparation of the nucleic acid target, RNA or DNA, into a form that is compatible with the sequencing system to be used (Figure 1).Figure 1. 

2015-10-07 08:54:28 1078

原创 转录组小知识点收集

转录组即特定细胞在某一功能状态下转录出来的所有RNA的总和,包括mRNA和非编码RNA。RNA-Seq,是基于新一代测序技术的转录组学研究方法:首先提取生物样品的全部转录的RNA并进行mRNA富集,然后反转录为 cDNA后进行的新一代高通量测序,在此基础上进行片段的拼接组装,从而可得到一个个的转录本,进而可以形成对该生物样品当前发育状态的基因表达状况的全局了解。不同阶段或部位的生物样品的RNA

2015-10-06 22:16:01 3255

原创 文库的构建及测序(未完待续)

提取样品总 RNA后,用带有Oligo(dT)的磁珠富集真核生物 mRNA(若为原核生物,则用试剂盒去除 rRNA后进入下一步)。加入 fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H 和DNA polymerase I合成第二条cDNA链,在经过 Q

2015-10-06 22:11:10 4500

原创 转录组(未完待续)

统计Mapped Reads在基因组的CDS(Exon)、Intron、Intergenic等区域的分布,用于检测测序序列在基因组上的来源,正常情况下,Exon(外显子)区域的测序序列定位的百分比含量应该最高,定位到Intron(内含子)区域的测序序列可能是由于非成熟的mRNA的污染或者基因组注释不完全导致的,而定位到Intergenic(基因间隔区域)的测序序列可能为基因组注释不完全以及背景噪音

2015-10-06 21:57:14 4513

转载 链特异性转录组测序

常规转录组测序首先将mRNA片段化,然后采用随机引物进行cDNA双链的合成。因此,常规转录组在测序序列中不能提供链方向的特征信息,很难确定反义转录本,且不能真实的反映转录情况。链特异性转录组测序(ssRNA-SEQ)是指在构建测序文库时,利用高保真Taq酶将mRNA链的方向信息保存到测序文库中。测序后的数据分析可确定转录本是来自正义还是反义DNA链。与普通转录组测序相比,它更能准确地统计转录本

2015-10-06 21:50:56 3427

翻译 引物设计的原则

Good primer design is essential for a successful PCR reaction. There are many factors to take into account when designing the optimal primers for your gene of interest. Here are some tips to consider

2015-10-06 16:41:48 2355

转载 Linux command 汇总(未完待续)

When downloading software, you will often find binaries labeled with either i386 or x86_64. Without going too deep into details, these numbers refer to the type of processor the binaries were compil

2015-10-06 15:43:20 390

原创 关于Bowtie

首先来说下以参考基因组建索引:下面是官网上的一个介绍bowtie-build builds a Bowtie index from a set of DNA sequences. bowtie-build outputs a set of 6 files with suffixes .1.ebwt, .2.ebwt, .3.ebwt, .4.ebwt, .rev.1.ebwt, a

2015-10-06 14:32:26 1812

原创 question(未完待续)

Why Call SNPs?How can we tell which mismatches represent real mutations and which are just noise?

2015-10-06 14:25:45 300

原创 example 收集(未完待续)

Go注释的例子:In an example of GO annotation, the gene product "cytochrome c" can be described by the Molecular Function term "oxidoreductase activity", the Biological Process terms "oxidative phospho

2015-10-06 14:06:20 308

转载 Using DAVID for GO and pathway enrichment analysi

网址:https://david.ncifcrf.gov/步骤:Upload or paste a gene listTo start DAVID, first click on "Functional Annotation" under "Shortcut to David tools" at the left of the home page. This will take

2015-10-06 09:52:28 895

原创 R包的安装

#记录小知识点,我的R版本是R-2.15.3安装R包的两种方式:手动安装:R console 上的package--》install package---》选择镜像---》然后选择要安装的包命令安装:install.packages("xlsx")

2015-10-05 21:49:02 1015

转载 单因素方差分析

单因素方差分析概念:是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。单因素方差分析步骤:第一步是明确观测变量和控制变量。例如,上述问题中的

2015-10-05 21:21:22 3053

原创 gene ID转换

Retrieve/ID mappingEnter identifiers, separated by a space or a new line, into the form field, for example:P31946 P62258ALBU_HUMANEFTU_ECOLIIf you need to convert to another identifi

2015-10-05 21:04:30 1782

原创 关于Trimmomatic

标题:Trimmomatic: A flexible trimmer for Illumina Sequence DataTrimmomatic as a more flexible and efficient pre-processing tool, which could correctly handle paired-end data.下载地址:http://www.usad

2015-10-05 19:21:44 1375

转载 GO 和 KEGG 注释之前,为什么要先进行序列比对(BLAST)?

在进行功能注释和通路注释之前,我们会先将差异蛋白与合适的数据库中的蛋白序列进行比对。目的一:很多物种目前研究的程度还很有限,关于这些物种的蛋白注释信息还很不完善。根据相似性原理,具有相似序列的蛋白可能也具有相似的功能,因此,我们可以将 BLAST 所得的同源蛋白的注释信息转嫁到我们关注的差异蛋白上,来完成对于差异蛋白尤其是研究程度不足的物种的差异蛋白的注释。目的二:我们在查库过程中,为了得到更多的

2015-10-05 19:03:42 10837

转载 一颗初心,慢煮岁月(最美文字)

在微信上看到的一篇文章,写的很不错,特此收藏每一天,我都欢喜着遇见,遇见更好的自己,遇见更好的你。我的心是一座城,藏有落叶,一簇花丛,还有那些来自岁月的点滴。萍水相逢的一笑,指路时的温暖,都是自然里开的花,是根植在心底的葱茏。用一颗如莲的心,画下最初的感动,遇见的刹那,我看到了岁月的慈悲。通幽的小径中,不是所有的微笑都能换来尊重和拥抱,那些属于我的,不论是快乐或是悲

2015-10-05 18:48:01 689

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除