生信分析
Janton Wang
这个作者很懒,什么都没留下…
展开
-
FastQC——测序数据质量分析
下载安装与配置cd ~wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.3.zipunzip fastqc_v0.11.3.zipcd FastQC/sudo gedit /etc/profile添加文件末尾并保存: export PATH=/home/WANGLAILAI_ubuntu...原创 2018-11-23 12:08:39 · 4941 阅读 · 0 评论 -
GenBank数据格式
GenBank数据格式以酿酒酵母TCP1β基因,部分编码区为例:关键字表关键字说明LOCUS【标记(简单描述)】:名称,长度,分子类型,数据分类(见下文),最后一次修订时间DEFINITION【定义】:物种/基因/蛋白质名称,编码区or非编码区,全序列or部分序列ACCESSION【检索号】VERSION【版本号】DBLINK【相关资源...原创 2019-02-17 18:06:33 · 10474 阅读 · 0 评论 -
分子生物学数据库
核酸研究(NAR)对所有的分子生物学数据库进行分类, 见 NAR Database Summary Paper Category List,包括:Nucleotide Sequence Databases (核酸数据库)RNA sequence databases (RNA序列数据库)Protein sequence databases (蛋白质序列数据库)Structure Datab...原创 2019-02-20 11:01:09 · 5194 阅读 · 0 评论 -
BLAST(基本局部比对工具)
nucletide blastblastn短序列标准搜索megablast相似序列(单物种)之间比对discontiguous megablast跨物种序列比对protein blastblasp标准搜索psi-blast使用blastp搜索结果构建位置特异性得分矩阵(PSSM)phi-blast发现具有相同表达模型且相似...原创 2019-02-20 11:17:53 · 6474 阅读 · 0 评论 -
【MATLAB生信分析】MATLAB生物信息分析工具箱(一)
这里给出 MATLAB_R2017a 的生物信息学工具箱中 自带的样例 一览:如果是默认安装,则相关目录在:C:\Program Files\MATLAB\R2017a\examples\bioinfo按字母排序如下:AlignMultipleSequencesExample.mAlignQuerySequenceToProfileUsingHMMModelAlignmentExa...原创 2018-11-10 10:59:32 · 4833 阅读 · 0 评论 -
【MATLAB生信分析】MATLAB生物信息分析工具箱(二)
AlignMultipleSequencesExample.m 蛋白质序列-多重比对:使用“GONNET”评分矩阵计算每一对序列之间的两两距离使用非加权平均距离(UPGMA)构建系统发育树使用PAM家族计分矩阵进行渐进式比对AlignQuerySequenceToProfileUsingHMMModelAlignmentExample.m...原创 2018-11-12 19:25:59 · 3635 阅读 · 0 评论 -
人类基因统计信息
以前的统计项目特征基因组大小3.2×1093.2\times10^93.2×109 bp常染色质92%蛋白质编码序列1.1%~1.4%RNA编码序列28%内含子序列24%基因间序列75%基因数目2万~2.5万已知编码蛋白质的基因19438预测编码蛋白质的基因2188基因数量最多的染色体chr19基...原创 2019-03-08 19:32:07 · 2287 阅读 · 1 评论 -
R语言基础
> ls()character(0)> n <- 5> ls()[1] "n"> x <- "acgt"&a原创 2019-03-15 19:21:53 · 1113 阅读 · 0 评论 -
1.Seqtk--fasta/fastq文件处理工具
sudo apt install seqtkseqtk原创 2019-09-30 20:03:13 · 1314 阅读 · 0 评论