自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 【数据库-4】clinvar

欢迎关注公众号:oddxix如果觉得写的不错记得点个赞哦!留步看一下这个讲解视频吧~~https://v.qq.com/x/page/m03789y9j98.html搭配这个pdf食用更佳哦~https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf1.简介网址https://www.ncbi...

2018-11-20 16:24:05 2336

原创 【SV分析-1】Manta

欢迎关注:oddxix1.介绍Manta由illumina开发,用于分析小集合的生殖变异与在个体的肿瘤/正常样品对中的体细胞变异。2.安装安装介绍 Manta installation instructions3.方法概述Manta将SV和indel发现过程分为两个主要步骤:(1)扫描基因组以找到SV相关区域;(2)在这些区域中发现的SV的分析,评分和输出3.1 Bu...

2018-11-19 17:40:53 4942

原创 【诺奖-1】2018年诺贝尔生理学或医学奖

欢迎关注公众号:oddxix北京时间2018年10月1日17:30,诺贝尔奖委员会公布了2018年生理学或医学奖获得者名单。艾利森与本庶佑分别作为免疫调节关键蛋白CTLA-4与PD-1的首度阐明者获奖者简介James P. Allison1948年,出生于美国得克萨斯州,1973年,获得德克萨斯大学博士学位,从2012年开始,就职于德克萨斯大学MD安德森癌症中心。201...

2018-11-19 17:39:56 4190

原创 【数据库-2】COSMIC遗传资源数据库

欢迎关注公众号:oddxixCOSMIC遗传资源数据库1.简介COSMIC是一个在人类癌症中发现的体细胞获得性突变的在线数据库。体细胞突变是在非生殖细胞中发生的,不是由儿童遗传的。 COSMIC是癌症中体细胞突变目录(Catalogue Of Somatic Mutations In Cancer)的首字母缩写,它从科学文献中的论文和桑格研究所癌症基因组计划的大规模实验筛选中提取数...

2018-11-19 17:38:46 4377

原创 【数据库-3】dbSNP数据库

欢迎关注公众号:oddxix1.dbSNP简介网址:https://www.ncbi.nlm.nih.gov/SNP/单核苷酸多态性数据库dbSNP(dbSNP, The Single Nucleotide Polymorphism Database)是由NCBI与人类基因组研究所(National Human Genome Research Institute)合作建立的,收录了SN...

2018-11-19 17:37:51 13736 1

原创 【数据库-1】1000 Genome Project 数据库

欢迎关注公众号:oddxix一、简介1000 Genomes Project(缩写为1KGP)于2008年1月启动,是一项国际研究工作,旨在建立迄今为止最详细的人类遗传变异目录。科学家计划在接下来的三年内使用新开发的技术对来自不同种族群体的至少一千名匿名参与者的基因组进行测序,这些技术更快,更便宜。 2010年,该项目完成了试验阶段,在“自然”杂志的一篇出版物中对此进行了详细描述。2012...

2018-11-19 17:23:28 4349

原创 FASTX-Toolkit

FASTX-Toolkit介绍背景介绍高通量测序数据下机后的原始fastq文件,包含4行,其中一行为质量值,另外一行则为对应序列,高通量的数据处理首先要进行质量控制,这些过程包括去接头、过滤低质量reads、去除低质量的3’和5’端,去除N较多的reads等,针对高通量测序数据的质控软件有很多,在此介绍质控工具:fastx_toolkitFASTX-ToolkitFASTX-To...

2018-09-11 15:32:26 3142 1

转载 高通量测序领域常用名词解释

高通量测序高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定, 因此在有些文献中称其为下一代测序技术(next generation sequencing,NGS )足见其划时代的改变, 同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能, 所以又...

2018-08-23 10:15:56 2972

转载 ggplot2--饼状图

原文出处:http://blog.csdn.net/bone_ace/article/details/47455363原始图样:library(ggplot2)dt = data.frame(A = c(2, 7, 4, 10, 1), B = c('B','A','C','D','E'))p = ggplot(dt, aes(x = "", y = A, fill = B)) + ...

2018-08-14 14:03:39 2721

原创 ggplot2画柱状图

柱状图一般有三种形式:填充式 堆积式 并列式填充式1)填充式需要设定几何对象geom_bar()的参数position='fill'(堆叠数据,百分比展示)首先数据格式是这样的: library(ggplot2)data<-data.frame(Sample<-c(rep('YDY019',3),rep('YDY022',3),rep('YDY069...

2018-08-01 15:41:12 16292 1

原创 R包——maftools可视化神器

参考:http://bioconductor.org/packages/release/bioc/vignettes/maftools/inst/doc/maftools.html目录 介绍准备格式转换 总体分析框架maftools安装正式处理#读入annovar文件转换为maf——annovarToMafDescriptionUsageArgume...

2018-08-01 10:47:49 15437 3

转载 R语言画韦恩图

1.安装和导入的包 install.packages("VennDiagram") library(grid) library(futile.logger) library(VennDiagram)2.两个数据集可以根据数据量的大小来确定圆的大小# A simple two-set diagram (根据数据量多少而确定圆的大小)前提是知道数据集的大小和交叉个数venn...

2018-07-25 12:55:16 23226

原创 BWA使用

全称:Burrows-Wheeler Aligner参考:https://www.cnblogs.com/zkkaka/p/6146214.htmlhttp://mingkang1217.blog.163.com/blog/static/2035227201101254921398/官方文档:http://www.bbioo.com/lifesciences/40-113315...

2018-07-17 16:08:12 8575 2

原创 sickle

对测序数据进行质控时,通常考虑三点:1.quality trimming2.adapter removal3.contaminant filtering除杂时我们用到了sickle,它能去除低质量的reads还能保证双端序列的完整性下载地址:https://github.com/najoshi/sickle 安装步骤:cd ~/biosoft mkdir sic...

2018-07-17 10:49:30 2735

原创 SeqPrep质控

一、描述SeqPrep is a program to merge paired end Illumina reads that areoverlapping into a single longer read. It may also just be used forits adapter trimming feature without doing any paired end overlap...

2018-07-16 14:49:23 2293

原创 外显子测序代码记录

#QC 使用SeqPrep进行质控SeqPrep -f /home/qian.liu/gaoyang/F18FTSECWLJ0595_HUMcizE/1625668PA_all/clean_data/CL100072979_L02_561_1.fq -r /home/qian.liu/gaoyang/F18FTSECWLJ0595_HUMcizE/1625668PA_all/clean_data...

2018-07-16 14:20:04 1180

原创 名词解释

1.SNPSNP:Single Nucleotide Polymorphisms单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性2.InDelInDel (insertion-deletion) 插入缺失标记,指的是两种亲本中在全基因组中的差异,相对另一个亲本而言,其中一个亲本的基因组中有一定数量的核苷酸插入或缺失...

2018-07-10 13:10:46 3565

转载 GATK流程

一、使用GATK前须知事项:(1)对GATK的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于illumina数据格式,目前还没有提供其他格式文件(如Ion Torrent)或者实验设计(RNA-Seq)的分析方法。(2)GATK是一个应用于前沿科学研究的软件,不断在更新和修正,因此,在使用GATK进行变异检测时,最好是下载最新的版本,目前的版本是4.0.6.0(2018.7.9)...

2018-07-09 09:36:41 16448 1

原创 NGS之数据格式

生物信息中常见的几种数据格式有:fasta、fastq、bam、sam、vcf、bed、gff。参考:http://www.biotrainee.com/thread-42-1-1.htmlFASTQ参考:https://en.wikipedia.org/wiki/FASTQ_formatfastq格式是文本格式。它有对应序列字符的质量分数,出于简洁的目的用ASCII字符来表示,所以fastq格式...

2018-07-06 09:24:31 2501

原创 Linux基本命令

.   代表此层目录..  代表上层目录以下图片来自:MOOC山东大学生物信息学   1.在linux下拷贝的时候出现cp:omitting directory的错误 ,例如 cp:omitting directory "bbs" 说明bbs目录下面还有目录,不能直接拷贝 解决办法:递归拷贝  命令:cp -r bbs ../backup...

2018-07-04 10:20:57 484

原创 PERL练习汇总

1.1读入file,将序列变成一行输出。use strict; #报错语句use warnings;open (FA,"file") or die $!; #打开文件句柄open (FB,">file1") or die $!;while (<FA>){ chomp; print FB $_;}print FB "\n";2.1读入file,将...

2018-07-02 17:33:48 3707 1

原创 perl学习笔记1

perl学习笔记11.perl语言的输入单行大文件的处理:my $oneline = <$FL> 或 while($line=<H>){ }读取全部(小文件的处理)open (my $in, "path ") or die "open error: $! ";my @lines = <$in> ;读3行以及大文件的特殊处理open (my $in, "path...

2018-05-10 11:37:03 399

原创 R代码

1.R代码练习1rm(list=ls())library(stringr)library(plyr)library(xlsx)library(Biostrings)library(splitstackshape)#质谱检测肽段长度 8到25个氨基酸,比较合适。MS_seq_length_min = 8MS_seq_length_max = 25# input file...

2018-05-04 16:04:38 2920

原创 BLAST使用

一、介绍全称Basic Local Alignment Search Tool,即"基于局部比对算法的搜索工具"Blast的运行方式是先用目标序列建数据库(这种数据库称为database,里面的每一条序列称为subject),然后用待查的序列(称为query)在database中搜索,每一条query与database中的每一条subject都要进行双序列比对,从而得出全部比对结果。Blast是一...

2018-04-23 17:05:29 9031

原创 R语言学习

练习1目的是想获取文件第二行数据,然后找出字符串长度。数据特点是每两行一个数据单元。偶数行为我所想得到的数据。代码如下rm(list = ls()) #清空环境变量#加载所需要使用的包library(seqinr) library(xlsx)设定工作目录setwd("D:/BaiduNetdiskDownload/OEdata")#读入数据od_data=readLine...

2018-04-12 11:26:42 1133

转载 转录组测序流程

转录组测序           转录组测序分析可以分为referring sequencing有参转录组分析和de novo无参转录组分析。有参无参的意思是,有/无参考基因组。          1.获得测序数据,Fastq格式,称之为Raw data。Fastq文件说明;每四行为一个单元。第一行:序列名称第二行:序列的碱基第三行:序列名称,可以使用+代替第四行:碱基的质量。质量值是用下列的ASC...

2018-04-10 15:18:47 8776

原创 linux入门学习1之FastQC

linux入门基础11. linux常用命令:pwd:显示当前工作目录exit或者ctrl+d:退出echo:打印    例如  x=1,echo $xgzip:压缩或解压缩   例如:gzip sample.fastq(压缩)   gzip -dc sample.fastq.gz(解压缩)  (后缀除了gz还可以有bz2)tar:打包或解包   语法:tar [参数] [...

2018-04-09 14:38:27 7497 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除