生信
文章平均质量分 86
分享学习
优惠券已抵扣
余额抵扣
还需支付
¥9.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
正在输入中…………
知识本身是在不断贬值的,组织知识的能力是在不断升值的!
从事IT行业10年,目前主要负责公司信息化建设和运维管理工作,工作精力分为两部分:第一部分是互联网行业高级运维;第二部分为基因行业IT建设,做过生物信息分析、公司信息化系统建设、IT整体规划、基础设施建设维护等。从底层小兵做起,逐步成长为公司IT负责人。
展开
-
SNAKEMAKE
Snakemake是一个工作流程管理系统。它是基于Python的、用于创建可重现和可扩展的数据分析的工具(当然现在也可以直接将它当做Python的一个模块)。Snakemake所创建的流程还可以无缝扩展到服务器、集群和云环境等不同环境转载 2022-12-27 14:41:13 · 576 阅读 · 0 评论 -
SGE安装部署完整过程-基于CentOS7
把多台服务器组成一个cluster集群(SGE),把控制节点的/home文件夹共享给其他服务器(NFS),公用一个/home文件夹,进行统一的用户管理(NIS)。SunGridEngine下载地址,https//arc.liv.ac.uk/downloads/SGE/releases/8.1.9/,(后续教程中也有相关内容,不需要提前下载)......原创 2022-07-19 18:10:18 · 1221 阅读 · 0 评论 -
基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS
目前市面上主流调度器有四大流派:LSF/SGE/Slurm/PBS。不同行业因为使用习惯和不同调度器对应用的支持力度不同,往往会有不同的偏好:比如高校和超算经常用Slurm,半导体公司最常用的是LSF和SGE,工业制造业可能用PBS更多一些。...转载 2022-07-06 17:35:29 · 9951 阅读 · 0 评论 -
ddPCR--数字微滴PCR
ddPCR–数字微滴PCRddPCR应用方向: 拷贝数变异研究、复杂来源样品中含量极低核酸分子的检测、NGS数据验证、NGS测序文库的鉴定、miRNA等差异微小的基因表达研究。1.ddPCR的背景介绍**ddPCR(dropletdigital PCR):**在传统的PCR扩增前对样品进行微滴化处理,即将含有核酸分子的反应体系分成成千上万个纳升级别的微滴(其中,每个微滴含有的待检测靶分子为0个、1个或多个)。经过PCR扩增之后,逐个对每个微滴进行检测,有荧光信号的微滴判读为1,没有荧光信号的微滴判读为转载 2022-04-14 17:20:13 · 1883 阅读 · 0 评论 -
qPCR与新冠病毒核酸检测
qPCR与新冠病毒核酸检测这篇文章简单记录一下qPCR核酸定量的原理以及它在新型冠状病毒检测中的应用,分享给身边好奇核酸检测的朋友,参考视频链接:https://www.bilibili.com/video/BV1454y1Q7U2/?spm_id_from=333.788.videocard.01. 荧光定量PCR关于荧光定量PCR基本概念(基线、荧光阈值、CT值、扩增曲线、熔解曲线),基线(Baseline):是指在PCR扩增反应的最初数个循环里荧光信号变化不大。接近一条直线,这样的直线即转载 2022-04-14 16:46:38 · 4794 阅读 · 1 评论 -
二代建库流程详解
二代建库流程详解越来越多的科研学者使用二代测序(Next-Generation Sequencing)进行自己课题研究,很多科研人员选择将样本直接寄送到二代测序科服公司进行实验。很多人可能并不了解文库构建的完整流程,今天小编就给大家介绍几种常见文库构建的流程。一. DNA建库流程:DNA建库的完整流程:基因组DNA片段化:由于目前测序仪读长有限,如双端各测150bp或75bp等,可采用酶打断和超声打断两种方式,酶打断操作更方便,更节省时间,但目前酶打断还有一定的偏好性,超声打断还是主流打断方式;转载 2022-04-14 16:41:59 · 6854 阅读 · 0 评论 -
10X Genomics单细胞转录组测序
10X Genomics单细胞转录组测序10X Genomics应用的两个方向:1. 可以做一群细胞当中,每个单细胞的RNA表达情况的定量分析(查看每个细胞的mRNA表达特征,并根据其表达特征划分细胞群体);2. 染色体的单倍体长片段的组装。这篇文章里只描述转录组测序。10X Genomics的工作基于液滴捕获技术,相对而言可定制化比较强,通量可以无限制增加,操作方便简单。通过液滴包裹单个磁珠和1个细胞,磁珠和细胞发生反应:细胞裂解后释放mRNA,磁珠上的引物尾巴可以做到与mRNA的特异性结合,从而转载 2022-04-14 16:09:26 · 3359 阅读 · 0 评论 -
Illumina测序原理
Illumina测序原理这里写目录标题Illumina测序原理1. 文库制备2. 成簇反应3. 测序阶段4. 数据分析illumina二代测序平台特点:基于可逆终止的、荧光标记dNTP,实现边合成、边测序的工作文字描述着实有很多局限性,文章起草基于这份视频(双端index),想要更轻松的阅读体验建议配合视频一起看:http://www.bilibili.com/video/av13107081/?share_source=copy_link&p=1&ts=1610448077&转载 2022-04-14 16:07:00 · 5167 阅读 · 0 评论 -
HRD检测方法
HRD检测方法HRD主要病因有3种:①突变(包括胚系BRCA基因、胚系HR基因和体细胞HR基因),②结构重排(LOH,杂合性丢失;TAI,端粒等位基因失平衡;LST,大片段迁移),③表观遗传修饰(启动子甲基化)。1:Loss of Heterozygosity杂合性缺失:1)长于15Mb,2)短于整个染色体LOH区域数量Abkevich V, Timms K M, Hennessy B T, et al. Patterns of genomic loss of heterozygosity pr原创 2022-04-13 13:50:41 · 1046 阅读 · 0 评论 -
BRCA1、BRCA2基因突变的检测方法与流程
BRCA1/2基因突变的检测方法与流程BRCA1和BRCA2均属肿瘤抑制基因,BRCA1/2编码的蛋白作用于多种细胞生命活动过程,包括DNA损伤修复、基因转录调控和细胞周期调节等。BRCA基因编码蛋白通过同源重组(homologous recombination)参与DNA双链 (dsDNA)损伤修复,BRCA1/2基因突变乳腺癌患者由于同源重组修复功能缺陷,可能对铂类或多聚(ADP-核糖)聚合酶[ poly ( ADP-ribose ) polymerase, PARP ]抑制剂等致DNA损伤药物更为敏原创 2021-11-02 13:15:00 · 3503 阅读 · 0 评论 -
使用C语言快速统计fastq文件q20、q30、GC含量
快速统计fastq文件q20、q30、GC含量二代测序的分析过程中,经常需要统计原始下机数据的数据量,看数据量是否符合要求;另外还需要统计q20,q30,GC含量等反应测序质量的指标;在kseq.h 的基础上稍加改造,就可以实现从fastq 文件中统计这些指标的功能,而且速度非常的快kseq.h下载地址:fastq_stat.c文件内容#include <zlib.h> #include <stdio.h>#include <string.h> #i原创 2021-01-15 17:33:53 · 2577 阅读 · 2 评论 -
HLA分型
HLA分型一、根据WES的tumor数据进行数据分型选用hlahd软件安装及使用[root@18605fd8771e ~]# wget https://jaist.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.4.1/bowtie2-2.4.1-linux-x86_64.zip[root@18605fd8771e ~]# unzip bowtie2-2.4.1-linux-x86_64.zip && mv bowtie2-2.4.1原创 2021-01-13 14:53:19 · 1981 阅读 · 0 评论 -
几种在NCBI中查询获取目的基因序列的方法
几种在NCBI中查询获取目的基因序列的方法在NCBI中,如何查询并下载获得某物种的某特定功能的基因序列,相信对于看到此篇的大部分同学来说都不陌生了。想到对于刚开始接触生信的同学们来说,也许尚不能很熟练地在NCBI中查询想要的基因序列,因此在这里简要作了一个总结,希望对初学生信的同学们有所帮助。此篇博文源于此前有同学问我,提到他导师给他布置任务,查找相关的文献,看相关文献中都报道了哪些细菌物种能够产生聚羟基脂肪酸酯(polyhydroxyalkanoate ,PHA),参与合成该产物的基因都有哪些,然后在原创 2021-01-12 11:28:40 · 11097 阅读 · 3 评论 -
01-00 分析环境准备
2 搭建分析环境在本文中,需要用到很多生信软件、各种数据库文件、编程环境等,可以在最开始的时候先把这些工作做好,当然有一些软件或者数据我们用到的时候再下载。为了做好文件的目录整理,我们可以先创建文件夹,以存放各种软件包、数据库文件,以及我们分析过程中的产生的结果。## 首先在用户的主目录下创建 wes_cancer 文件夹作为工作目录mkdir ~/wes_cancercd ~/wes_cancer## 在 ~/wes_cancer 中创建 biosoft project data 三个文件夹原创 2021-01-08 16:15:26 · 346 阅读 · 0 评论 -
15 PyClone推断肿瘤细胞的克隆组成
15 PyClone推断肿瘤细胞的克隆组成写在前面参考资料:https://bitbucket.org/aroth85/pyclone/wiki/Usagehttp://www.bio-info-trainee.com/3964.htmlhttps://www.nature.com/articles/nmeth.2883PyClone介绍上 一节我们提到肿瘤细组织是一个由正常细胞和肿瘤细胞组成的混合组织,而肿瘤中存在的异质性也导致了分析起来更加复杂。由癌细胞分裂的后代呈现的基因原创 2021-01-08 16:20:18 · 1839 阅读 · 4 评论 -
14 ABSOLUTE评估肿瘤纯度
14 ABSOLUTE评估肿瘤纯度Absolute介绍ABSOLUTE可以直接从体细胞突变和拷贝数变异的结果中推断肿瘤纯度和倍性的计算方法。通常来说,我们取肿瘤组织进行测序,往往是一个混合样品,既包括肿瘤细胞也包括正常细胞,因此需要进行肿瘤纯度 purity 的评估。当从混合样品中提取 DNA 进行测序后,得到的也是一个混合样品的结果。肿瘤不一定是单纯的二倍体了,其本身异质性高,存在部分突变部分不突变的情况,直接分析拷贝数变异,得到的结果并不准确,评估肿瘤倍性 ploidy 也更加必要。而 ABSO原创 2021-01-08 16:20:03 · 3569 阅读 · 0 评论 -
13 对发生拷贝数变异的基因进行 KEGG 注释
13 对发生拷贝数变异的基因进行 KEGG 注释数据准备首先还是同样的读入数据,进行一定的处理。我们同样用 VEP 注释后的 maf 文件,然后取出需要用到的几列rm(list=ls())options(stringsAsFactors = F)library(dplyr)library(stringr)# 读入数据laml = read.maf('./7.annotation/vep/VEP_merge.maf')laml@data=laml@data[!grepl('^MT-',lam原创 2021-01-08 16:19:51 · 604 阅读 · 0 评论 -
12 初探肿瘤异质性
12 初探肿瘤异质性同一个病人的 SNV 分布数据准备首先还是同样的读入数据,进行一定的处理。我们同样用 VEP 注释后的 maf 文件,然后取出需要用到的几列rm(list = ls())options(stringsAsFactors = F)library(dplyr)library(stringr)# 读入数据laml = read.maf('./7.annotation/vep/VEP_merge.maf')laml@data = laml@data[!grepl('^MT-'原创 2021-01-08 16:19:29 · 679 阅读 · 0 评论 -
11 突变 Somatic Signature 图谱
11 突变 Somatic Signature 图谱在 前面几节的数据分析中,我们从原始数据一直分析到了 Somatic mutations,进行了 maftools 可视化,然后还分析了 cnv ,对比了多个软件的分析结果。接下来我们来分析一下 Somatic mutations Signatures,用到是 R 包 deconstructSigs。Mutations Signature介绍首先,对于点突变 SNV 的类型,可以分为 6 类:C>A, C>G,C>T, A>原创 2021-01-08 16:19:14 · 2288 阅读 · 0 评论 -
10 拷贝数变异分析(非GATK)
12 拷贝数变异分析(非GATK)CNVkitCNVkit 的用法比较简单,可以参考官网的教程:https://cnvkit.readthedocs.io/en/stable/index.html,写得很 详细,这里我不再说明。下面是我用到的脚本(在这里我比较关心的是最后拿到的 segment 文件,即 final.seg,该文件可以用直接载入到 IGV 进行可视化,当然也可以用 cnvkit.py export 生成这样的 segments 文件,两者基本一样,然后和上一节 GATK 的结果进行比较原创 2021-01-08 16:19:02 · 1781 阅读 · 0 评论 -
09 拷贝数变异分析(GATK流程)
09 拷贝数变异分析(GATK流程)我们已经分析了 Somatic mutations,并进行了注释和可视化,接下来我们进行拷贝数变异的分析。这里我们还是先从 GATK 的 somatic cnv 的最佳实践开始拷 贝数变异(copy number variations, CNVs)是属于基因组结构变异(structural variation, SV),是指 DNA 片 段长度在 1Kb-3Mb 的基因组结构变异。我们首先从 GATK 的 CNV 流程开始 CNV 的分析。首先是流程图,先从 b原创 2021-01-08 16:18:52 · 4856 阅读 · 5 评论 -
08 比较不同注释软件可视化结果
08 比较不同注释软件可视化结果在 前面两节中,我们比较了不同 vcf 注释软件的使用,以及将注释后的记过转换成了 maf 格式的文件,由于snpeff 注释结果暂时无法转换成 maf,所以后面我们就比较 ANNOVAR、VEP、GATK Funcatator 的注释结果得到的合并后的 maf 文件。首先将拿到的结果载入到R语言中,然后用 maftool 可视化,代码如下:读入数据rm(list = ls())require(maftools)options(stringsAsFactors原创 2021-01-08 16:18:41 · 952 阅读 · 0 评论 -
06不同 vcf 注释软件的安装及使用
06不同 vcf 注释软件的安装及使用前 面我们通过 GATK 的 mutect 流程找到了 somatic mutations,但是只有突变的染色体和坐标信息,我们并不知道该突变发生在哪个基因或者哪号外显子,显然通过坐标进行手动查看的方法是不科学的。应 该通过软件来实现,这里我们比较四个vcf注释软件的安装及使用:vep、annovar、gatk funcatator、snpeff这一节我们将比较不同注释软件(vep,annovar,gatk funcatator,snpeff) 的安装及使用,按照原创 2021-01-08 16:17:24 · 1550 阅读 · 1 评论 -
05GATK流程和找变异
05GATK流程和找变异GATK 集合了一套功能全面的高通量测序数据基因组分析工具包,算是业界的权威,更新的速度非常快。需要注意的是,不同版本的 GATK 在工具应用上会有些许不同。这里我们使用是最新版本 GATK 4.1.4.1(截止2019年12月31日)。数据准备前面我们提到了,走GATK流程需要到官网下载很多数据库文件,比如下面这些:dbsnp_146.hg38.vcf.gz dbsnp_146.hg38.vcf.gz.tbi Mills_and_1000G_gold_standard.原创 2021-01-08 16:17:12 · 1277 阅读 · 0 评论 -
04比对结果的质控
04比对结果的质控我们得到了 bam 文件之后,也要进行质控,可以对测序数据有更深入的理解。因此我们用几种方法来检查 bam 文件结果。samtools stats## stats.shcat config | while read iddo bam=./4.align/${id}.bam samtools stats -@ 16 --reference ~/wes_cancer/data/Homo_sapiens_assembly38.fasta ${bam} > ./4.alig原创 2021-01-08 16:17:02 · 701 阅读 · 0 评论 -
03比对与 bam 文件格式
03比对与 bam 文件格式参考基因组及索引通 过 trim 过滤后的到的 fq,需要比对到参考基因组上才能让这些数据有意义。前面我们已经下载了人类参考基因组 hg38 版本,而且是从 GATK 数据库下载的,原文件大小为 800 多M,解压后为 3G 左右。同时也需要构建该参考基因组的 bwa 索引文件,即:20K gatk_hg38.amb 3.0G gatk_hg38.bwt 1.5G gatk_hg38.sa 445K gatk_hg38.ann 768原创 2021-01-08 16:16:16 · 739 阅读 · 0 评论 -
02质控与去接头
02质控与去接头fq 格式说明从 sra 转格式后拿到的 fq 文件是测序原始的 fq ,记录了测序得到的 reads 的碱基序列和对应质量值,如case1_biorep_A_techrep_1.fastq.gz的前 8 行,以每 4 行为单位,作为一条 reads 的完整记录:@case1_biorep_A_techrep.1/1 1 length=76AACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTA原创 2021-01-08 16:15:53 · 621 阅读 · 0 评论 -
01读文献并下载数据
01读文献并下载数据阅读文献本 文分析的数据来自于文章:Reliability of Whole-Exome Sequencing for Assessing Intratumor Genetic Heterogeneity, Shi et al., 2018, Cell Reportshttps://doi.org/10.1016/j.celrep.2018.10.046[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NjX4pXbq-1589967544203)(原创 2021-01-08 16:15:38 · 332 阅读 · 0 评论 -
16 利用 Citup+Timescape 做肿瘤进化鱼图
利用 Timescape 做肿瘤进化鱼图写在前面前面我们使用 pyclone 分析了肿瘤样本的 clusters 结构,接下来我们进一步分析肿瘤进化,画一个鱼图,需要用到的工具是 citup 和 Timescape参考:https://github.com/sfu-compbio/cituphttps://shahlab.ca/projects/citup/https://www.cnblogs.com/xlij1205/p/10848917.htmlhttps://bioconductor原创 2021-01-08 16:20:42 · 2344 阅读 · 10 评论