【数据库-4】clinvar 欢迎关注公众号:oddxix如果觉得写的不错记得点个赞哦!留步看一下这个讲解视频吧~~https://v.qq.com/x/page/m03789y9j98.html搭配这个pdf食用更佳哦~https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf1.简介网址https://www.ncbi...
【数据库-4】clinvar 欢迎关注公众号:oddxix如果觉得写的不错记得点个赞哦!留步看一下这个讲解视频吧~~https://v.qq.com/x/page/m03789y9j98.html搭配这个pdf食用更佳哦~https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf1.简介网址https://www.ncbi...
【SV分析-1】Manta 欢迎关注:oddxix1.介绍Manta由illumina开发,用于分析小集合的生殖变异与在个体的肿瘤/正常样品对中的体细胞变异。2.安装安装介绍 Manta installation instructions3.方法概述Manta将SV和indel发现过程分为两个主要步骤:(1)扫描基因组以找到SV相关区域;(2)在这些区域中发现的SV的分析,评分和输出3.1 Bu...
【诺奖-1】2018年诺贝尔生理学或医学奖 欢迎关注公众号:oddxix北京时间2018年10月1日17:30,诺贝尔奖委员会公布了2018年生理学或医学奖获得者名单。艾利森与本庶佑分别作为免疫调节关键蛋白CTLA-4与PD-1的首度阐明者获奖者简介James P. Allison1948年,出生于美国得克萨斯州,1973年,获得德克萨斯大学博士学位,从2012年开始,就职于德克萨斯大学MD安德森癌症中心。201...
【数据库-2】COSMIC遗传资源数据库 欢迎关注公众号:oddxixCOSMIC遗传资源数据库1.简介COSMIC是一个在人类癌症中发现的体细胞获得性突变的在线数据库。体细胞突变是在非生殖细胞中发生的,不是由儿童遗传的。 COSMIC是癌症中体细胞突变目录(Catalogue Of Somatic Mutations In Cancer)的首字母缩写,它从科学文献中的论文和桑格研究所癌症基因组计划的大规模实验筛选中提取数...
【数据库-3】dbSNP数据库 欢迎关注公众号:oddxix1.dbSNP简介网址:https://www.ncbi.nlm.nih.gov/SNP/单核苷酸多态性数据库dbSNP(dbSNP, The Single Nucleotide Polymorphism Database)是由NCBI与人类基因组研究所(National Human Genome Research Institute)合作建立的,收录了SN...
【数据库-1】1000 Genome Project 数据库 欢迎关注公众号:oddxix一、简介1000 Genomes Project(缩写为1KGP)于2008年1月启动,是一项国际研究工作,旨在建立迄今为止最详细的人类遗传变异目录。科学家计划在接下来的三年内使用新开发的技术对来自不同种族群体的至少一千名匿名参与者的基因组进行测序,这些技术更快,更便宜。 2010年,该项目完成了试验阶段,在“自然”杂志的一篇出版物中对此进行了详细描述。2012...
FASTX-Toolkit FASTX-Toolkit介绍背景介绍高通量测序数据下机后的原始fastq文件,包含4行,其中一行为质量值,另外一行则为对应序列,高通量的数据处理首先要进行质量控制,这些过程包括去接头、过滤低质量reads、去除低质量的3’和5’端,去除N较多的reads等,针对高通量测序数据的质控软件有很多,在此介绍质控工具:fastx_toolkitFASTX-ToolkitFASTX-To...
高通量测序领域常用名词解释 高通量测序高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又...
ggplot2--饼状图 原文出处:http://blog.csdn.net/bone_ace/article/details/47455363原始图样:library(ggplot2)dt = data.frame(A = c(2, 7, 4, 10, 1), B = c('B','A','C','D','E'))p = ggplot(dt, aes(x = "", y = A, fill = B)) + ...
ggplot2画柱状图 柱状图一般有三种形式:填充式 堆积式 并列式填充式1)填充式需要设定几何对象geom_bar()的参数position='fill'(堆叠数据,百分比展示)首先数据格式是这样的: library(ggplot2)data<-data.frame(Sample<-c(rep('YDY019',3),rep('YDY022',3),rep('YDY069...
R包——maftools可视化神器 参考:http://bioconductor.org/packages/release/bioc/vignettes/maftools/inst/doc/maftools.html目录 介绍准备格式转换 总体分析框架maftools安装正式处理#读入annovar文件转换为maf——annovarToMafDescriptionUsageArgume...
R语言画韦恩图 1.安装和导入的包 install.packages("VennDiagram") library(grid) library(futile.logger) library(VennDiagram)2.两个数据集可以根据数据量的大小来确定圆的大小# A simple two-set diagram (根据数据量多少而确定圆的大小)前提是知道数据集的大小和交叉个数venn...
BWA使用 全称:Burrows-Wheeler Aligner参考:https://www.cnblogs.com/zkkaka/p/6146214.htmlhttp://mingkang1217.blog.163.com/blog/static/2035227201101254921398/官方文档:http://www.bbioo.com/lifesciences/40-113315...
sickle 对测序数据进行质控时,通常考虑三点:1.quality trimming2.adapter removal3.contaminant filtering除杂时我们用到了sickle,它能去除低质量的reads还能保证双端序列的完整性下载地址:https://github.com/najoshi/sickle 安装步骤:cd ~/biosoft mkdir sic...
SeqPrep质控 一、描述SeqPrep is a program to merge paired end Illumina reads that areoverlapping into a single longer read. It may also just be used forits adapter trimming feature without doing any paired end overlap...
外显子测序代码记录 #QC 使用SeqPrep进行质控SeqPrep -f /home/qian.liu/gaoyang/F18FTSECWLJ0595_HUMcizE/1625668PA_all/clean_data/CL100072979_L02_561_1.fq -r /home/qian.liu/gaoyang/F18FTSECWLJ0595_HUMcizE/1625668PA_all/clean_data...
名词解释 1.SNPSNP:Single Nucleotide Polymorphisms单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性2.InDelInDel (insertion-deletion) 插入缺失标记,指的是两种亲本中在全基因组中的差异,相对另一个亲本而言,其中一个亲本的基因组中有一定数量的核苷酸插入或缺失...
GATK流程 一、使用GATK前须知事项:(1)对GATK的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于illumina数据格式,目前还没有提供其他格式文件(如Ion Torrent)或者实验设计(RNA-Seq)的分析方法。(2)GATK是一个应用于前沿科学研究的软件,不断在更新和修正,因此,在使用GATK进行变异检测时,最好是下载最新的版本,目前的版本是4.0.6.0(2018.7.9)...
NGS之数据格式 生物信息中常见的几种数据格式有:fasta、fastq、bam、sam、vcf、bed、gff。参考:http://www.biotrainee.com/thread-42-1-1.htmlFASTQ参考:https://en.wikipedia.org/wiki/FASTQ_formatfastq格式是文本格式。它有对应序列字符的质量分数,出于简洁的目的用ASCII字符来表示,所以fastq格式...