- 博客(27)
- 收藏
- 关注
转载 Extract lowercase masked FASTA from a BLAST database with masking information
If a BLAST database contains masking information, this can be extracted using the blastdbcmd options –db_mask and –mask_sequence as follows:$ blastdbcmd -info -db mask-data-dbDatabase: Mask data te
2015-10-17 09:46:40 650
原创 本地blast
目前本地blast的版本:下载:wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/解压:tar zxvpf ncbi-blast-2.2.31+-x64-linux.tar.gz之后生成一个文件夹:ncbi-blast-2.2.31+Under bash, the followi
2015-10-16 15:34:01 1044
原创 待整理
Seed-and-extend alignersAn alignment strategy that first builds a hash table containing the location of each k-mer (seed) within thereference genome. These algorithms then extend these seeds
2015-10-15 13:54:18 325
原创 edgeR(未完)
edgeR的安装:source("http://bioconductor.org/biocLite.R") biocLite("edgeR")查看R的当前工作目录:> getwd()[1] "D:/My Documents"载入包:library(limma)library(edgeR)读取数据:raw.data 查看数据
2015-10-14 16:00:01 2398
转载 质量值体系 Phred33 和 Phred 64 的由来 及其在质量控制中的实际影响
最近在学习质控知识时, 对于质量值体系及转换产生了一些疑问, 作了一些尝试, 趁集群故障, 在此总结一下质量值体系相比之前培训时所学的质控内容, (我拿到的) 流程中还多了一步 phred33to64, 也就是把 .fastq 格式的数据从 Phred33 质量值体系转换为 Phred64 质量体系, 于是先补充学习了下质量值体系:首先要从质量值说起, 测序仪器下机数
2015-10-07 14:36:54 8551
转载 VCFtools quality filtering
VCFtools provide a wide range of functionality for the filtering, analysis and transformation of vcf files. Typically, SNPs of quality < 20 and read depth < 20 are filtered out as they are considere
2015-10-07 14:15:06 826
原创 Read alignment后的质量控制
Drop low-quality alignments: Each alignment is given a quality score (MAPQ) which is equivalent to Phred scores (with respect to determining relative quality of different alignments). You can screen f
2015-10-07 13:46:42 870
原创 命令行整理
提取fastq文件中的一部分序列来进行测试:zcat ERR022075pe.fasta.gz | head 1500000 > subset.fasta
2015-10-07 12:48:49 362
转载 Genome denovo assembly using velvet
Velvet is denovo assembler suitable for small genomes. It is based on deBruijn graph andwe must define kmer length when using it.In practice you should try several assemblies with different values
2015-10-07 12:43:35 367
原创 分子生物学上的生物定义整理
#经常遇到的问题是,很多时候一些看是简单的生物学小知识点,突然忘记什么意思,所以决定在这里记下学习过程中,遇到的一些小的知识点,以备方便查阅。############################寡核苷酸,是一类只有20个以下碱基的短链核苷酸的总称(包括脱氧核糖核酸DNA或核糖核酸RNA内的核苷酸),寡核苷酸可以很容易地和它们的互补对链接,所以常用来作为探针确定DNA或RNA的结
2015-10-07 09:41:47 522
原创 NGS library construction(未完待续)
基本原理:Fundamental to NGS library construction is the preparation of the nucleic acid target, RNA or DNA, into a form that is compatible with the sequencing system to be used (Figure 1).Figure 1.
2015-10-07 08:54:28 1078
原创 转录组小知识点收集
转录组即特定细胞在某一功能状态下转录出来的所有RNA的总和,包括mRNA和非编码RNA。RNA-Seq,是基于新一代测序技术的转录组学研究方法:首先提取生物样品的全部转录的RNA并进行mRNA富集,然后反转录为 cDNA后进行的新一代高通量测序,在此基础上进行片段的拼接组装,从而可得到一个个的转录本,进而可以形成对该生物样品当前发育状态的基因表达状况的全局了解。不同阶段或部位的生物样品的RNA
2015-10-06 22:16:01 3255
原创 文库的构建及测序(未完待续)
提取样品总 RNA后,用带有Oligo(dT)的磁珠富集真核生物 mRNA(若为原核生物,则用试剂盒去除 rRNA后进入下一步)。加入 fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H 和DNA polymerase I合成第二条cDNA链,在经过 Q
2015-10-06 22:11:10 4500
原创 转录组(未完待续)
统计Mapped Reads在基因组的CDS(Exon)、Intron、Intergenic等区域的分布,用于检测测序序列在基因组上的来源,正常情况下,Exon(外显子)区域的测序序列定位的百分比含量应该最高,定位到Intron(内含子)区域的测序序列可能是由于非成熟的mRNA的污染或者基因组注释不完全导致的,而定位到Intergenic(基因间隔区域)的测序序列可能为基因组注释不完全以及背景噪音
2015-10-06 21:57:14 4513
转载 链特异性转录组测序
常规转录组测序首先将mRNA片段化,然后采用随机引物进行cDNA双链的合成。因此,常规转录组在测序序列中不能提供链方向的特征信息,很难确定反义转录本,且不能真实的反映转录情况。链特异性转录组测序(ssRNA-SEQ)是指在构建测序文库时,利用高保真Taq酶将mRNA链的方向信息保存到测序文库中。测序后的数据分析可确定转录本是来自正义还是反义DNA链。与普通转录组测序相比,它更能准确地统计转录本
2015-10-06 21:50:56 3427
翻译 引物设计的原则
Good primer design is essential for a successful PCR reaction. There are many factors to take into account when designing the optimal primers for your gene of interest. Here are some tips to consider
2015-10-06 16:41:48 2355
转载 Linux command 汇总(未完待续)
When downloading software, you will often find binaries labeled with either i386 or x86_64. Without going too deep into details, these numbers refer to the type of processor the binaries were compil
2015-10-06 15:43:20 390
原创 关于Bowtie
首先来说下以参考基因组建索引:下面是官网上的一个介绍bowtie-build builds a Bowtie index from a set of DNA sequences. bowtie-build outputs a set of 6 files with suffixes .1.ebwt, .2.ebwt, .3.ebwt, .4.ebwt, .rev.1.ebwt, a
2015-10-06 14:32:26 1812
原创 question(未完待续)
Why Call SNPs?How can we tell which mismatches represent real mutations and which are just noise?
2015-10-06 14:25:45 300
原创 example 收集(未完待续)
Go注释的例子:In an example of GO annotation, the gene product "cytochrome c" can be described by the Molecular Function term "oxidoreductase activity", the Biological Process terms "oxidative phospho
2015-10-06 14:06:20 308
转载 Using DAVID for GO and pathway enrichment analysi
网址:https://david.ncifcrf.gov/步骤:Upload or paste a gene listTo start DAVID, first click on "Functional Annotation" under "Shortcut to David tools" at the left of the home page. This will take
2015-10-06 09:52:28 895
原创 R包的安装
#记录小知识点,我的R版本是R-2.15.3安装R包的两种方式:手动安装:R console 上的package--》install package---》选择镜像---》然后选择要安装的包命令安装:install.packages("xlsx")
2015-10-05 21:49:02 1015
转载 单因素方差分析
单因素方差分析概念:是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。单因素方差分析步骤:第一步是明确观测变量和控制变量。例如,上述问题中的
2015-10-05 21:21:22 3053
原创 gene ID转换
Retrieve/ID mappingEnter identifiers, separated by a space or a new line, into the form field, for example:P31946 P62258ALBU_HUMANEFTU_ECOLIIf you need to convert to another identifi
2015-10-05 21:04:30 1782
原创 关于Trimmomatic
标题:Trimmomatic: A flexible trimmer for Illumina Sequence DataTrimmomatic as a more flexible and efficient pre-processing tool, which could correctly handle paired-end data.下载地址:http://www.usad
2015-10-05 19:21:44 1375
转载 GO 和 KEGG 注释之前,为什么要先进行序列比对(BLAST)?
在进行功能注释和通路注释之前,我们会先将差异蛋白与合适的数据库中的蛋白序列进行比对。目的一:很多物种目前研究的程度还很有限,关于这些物种的蛋白注释信息还很不完善。根据相似性原理,具有相似序列的蛋白可能也具有相似的功能,因此,我们可以将 BLAST 所得的同源蛋白的注释信息转嫁到我们关注的差异蛋白上,来完成对于差异蛋白尤其是研究程度不足的物种的差异蛋白的注释。目的二:我们在查库过程中,为了得到更多的
2015-10-05 19:03:42 10837
转载 一颗初心,慢煮岁月(最美文字)
在微信上看到的一篇文章,写的很不错,特此收藏每一天,我都欢喜着遇见,遇见更好的自己,遇见更好的你。我的心是一座城,藏有落叶,一簇花丛,还有那些来自岁月的点滴。萍水相逢的一笑,指路时的温暖,都是自然里开的花,是根植在心底的葱茏。用一颗如莲的心,画下最初的感动,遇见的刹那,我看到了岁月的慈悲。通幽的小径中,不是所有的微笑都能换来尊重和拥抱,那些属于我的,不论是快乐或是悲
2015-10-05 18:48:01 689
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人