自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

原创 知识积累 | GATK的使用

在mutation calling的过程中,最常使用的一个软件就是GATK,我想要弄明白:(1)GATK能够做什么?(2)GATK如何使用?链接:https://www.plob.org/article/11698.html这个作者实在是太强了。他在文末有分享了这样的一段话:在这里,整篇文章就结束了。如你所见,文章非常长,这里基本包含了WGS最佳实践中的所有内容,但其实我想说的还远不止如此(包括CNV和SV的检测),只是暂时只能作罢了,否则恐怕就没人愿意看下去了,呵呵。在这个WGS主流程的.

2021-05-28 13:10:21 1631

原创 知识积累 | 10X数据是个啥?

之前说,实验室主要使用的是10X的数据,但是我现在对于10X的数据的了解很少。所以,想更进一步的了解一下。从网页上搜集到资源,整理如下。RNA-seq技术的主要的目标就是(1)定性(2)定量。所以,在某种程度上,就是围绕着两个目标进行的,只不过提出的解决方法会有所不同。一句话总结:单细胞测序技术与单细胞核测序技术的区别?简而言之,就是单细胞测序技术存在一些弊端。只能够取样于新鲜组织,而一些临床的冷冻的样本,无法得到利用。在解离的过程中,一些细胞这种应激的条件下,基因的表达发生变化。同时,一些不易解.

2021-05-24 21:15:46 2054

原创 实验记录 | 测试数据集CTCL患者样本

上次有询问,主要使用CTCL患者的哪些样本的信息。今天早上,作者的回答是:CTCL-cDNA is used for calling variants and inferring missing data points.CTCL-TCRab is used for lineages validation.而结合上一次,我们询问原作者关于这方面的数据,作者的回答是:ADT stands for Antibody Derived Tag, and it’s the cell barcode-by-

2021-05-24 12:11:05 265

原创 经验总结 | 如何使用服务器上传下载文件

写在前面:最近由于项目的需求,需要利用服务器来进行大批量的数据处理。所以,现在就集中的学习一下,服务器的使用。有句话说,有需求才有学习的motivation。我深以为然。最直接的方法就是,在做中学。1。登录服务器ssh 用户名@IP地址示例:ssh [email protected]。文件的操作(1)文件传输服务器传文件到电脑sz test.txt电脑传文件到服务器rz test.txt(2)文件下载(3)拷贝文件到某个文件夹下scp(4.

2021-05-20 11:55:22 2224

原创 实验记录 | 梳理代码2

凡事预则立,不预则废。我就不相信我多下一点功夫会搞不定它。我一定要把它弄清楚。刚刚看到github上关于这个流程的讨论,对于作者佩服的不行。觉得只有更加的努力,才能在这个领域有自己的一席之地。想想看已经有学弟比自己厉害了。既然学弟可以顺利的跑下来,那么我想,我也可以。我想成为这个领域最厉害的那20%。进阶之路真的是永无止境啊。这篇文章,我打算梳理一下github上,ORBC pipeline的框架。都主要有哪一些的文件。并且每一个文件的意思是什么?那个学弟之所以可以与作者“对话”,主要原因还是细致.

2021-05-16 21:44:33 329

原创 实验记录 | somatic.pl的运行3

接2的程序,又报了一系列的错误,我们再次整理。ERROR MESSAGE: Unable to retrieve resultERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor/tumor_intervals.list because The interval file does not exist.ERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor

2021-05-16 21:42:57 1646 2

原创 经验总结 | 建索引的五种方式

最近真的是遇到了各种类型的索引,所以觉得有必要总结一下。bowite索引bwa索引dict索引fai索引最后我将这些索引,上传到百度网盘中,以备不时之须。hg19因为构建索引的过程实在是太耗功夫了。所以很有必要及时的备份。另外,我觉得我的移动硬盘马上就要到了,我要把ORBC的分析流程移动到硬盘上去弄,到时候只需要调用绝对路径即可。...

2021-05-16 18:09:04 10334

原创 实验记录 |somatic.pl的运行2

一个同学分享了一个网盘文件,上面有gatk相关的文件,所以我尝试下载,是否能够使用。参考链接:https://blog.csdn.net/xxxie_/article/details/100111991我的心态是崩的,原来早就有同学分享到网盘里了。我也有匆匆浏览过这个网页,但是没有注意到它在文后的一个分享。还是要静下来去做事吧!...

2021-05-15 15:09:47 542 1

原创 实验记录 | 梳理代码1

参考链接:https://github.com/tianshilu/QBRC-Somatic-Pipeline1。job_somatic.pl这个代码文件,实际上是前面介绍的somatic.pl的衍生物。适用的情况是对多个fastq文件进行somatic.pl批处理。也即文件多了一点罢了。需要提前写好文件(somatic_design.txt)。文档中包括:数据文件的地址、输出的文件夹、物种~/seq/1799-01N.R1.fastq.gz ~/seq/1799-01N.R2.f.

2021-05-14 20:38:53 158

原创 实验记录 | 阶段性汇报1

链接:https://gatk.broadinstitute.org/hc/en-us/articles/360035531652-FASTA-Reference-genome-format

2021-05-13 22:41:25 3608

原创 实验记录 | somatic.pl运行1

1。ORBC mutation pipeline参考链接:https://github.com/Somatic-pipeline/QBRC-Somatic-Pipeline/tree/master/example/example_dataset/sequencing.输入数据流程输入文件的格式:fastq文件或者bam文件,或者两者的混合。测试数据:https://github.com/Somatic-pipeline/QBRC-Somatic-Pipeline/tree/master/

2021-05-13 22:35:55 851

原创 实验记录 | 梳理关键结果

【大纲】基本素材:(1)文献:https://www.biorxiv.org/content/10.1101/2020.01.01.892562v1.full(2)ORBC的处理流程:https://github.com/tianshilu/QBRC-Somatic-Pipeline今天下午要完成的事情:(1)根据文献理明白,文献分析10X的数据,得到的关键结果是什么?(2)下载实验数据,数据的背景(研究什么问题)是什么?弄清楚实验分析从哪一处的数据开始?(3)梳理ORBC处理流程,开始运.

2021-05-13 09:58:53 208

原创 实验记录 | STAR的安装

下载source包。https://github.com/alexdobin/STAR/archive/refs/tags/2.7.9a.tar.gz解压到指定文件夹下。tar -zxvf STAR-2.7.9a.tar.gzcd STAR_2.7.9acd sourcemake STAR同样的,配置环境变量。STAR指令在bin文件夹下的Linux_x86_64内。sudo vi ~/.bashrcexport PATH=/home/zxx/workplace/STAR/bin/Li

2021-05-11 15:07:10 1039 1

原创 实验记录 | BWA的安装

官网简介:http://bio-bwa.sourceforge.net/BWA is a software package for mapping low-divergent sequences against a large reference genome, such as the human genome. It consists of three algorithms: BWA-backtrack, BWA-SW and BWA-MEM. The first algorithm is desig

2021-05-11 14:21:17 2363

原创 实验记录 | bowite2安装

我首先使用conda进行安装,但是最后出现了与samtools相似的问题,于是,现在直接下载软件包。https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.4.2/从列表中选择适用于linux系统的软件包(linux-x86_64)。解压。unzip bowtie2-2.4.2-linux-x86_64.zip配置环境变量。sudo vi ~/.bashrc在文件中添加bowite2的系统安装路径:export PATH="/

2021-05-10 16:51:18 1276

原创 实验记录 | Annoar的安装

https://www.openbioinformatics.org/annovar/annovar_download_form.php在这个链接中下载软件,只不过需要教育类的邮箱。然而,我已经毕业了,刚刚看了一下苏大邮箱过期了,悲剧。下载链接:http://www.openbioinformatics.org/annovar/download/0wgxR2rIVP/annovar.latest.tar.gz...

2021-05-10 16:26:19 1885 1

原创 实验记录 | Lofreq的安装

参考链接:http://csb5.github.io/lofreq/这篇文章中有介绍若干安装lofreq的方法,其中使用conda安装则最为简单,因此,本文使用conda进行Lofreq的安装。参考链接:https://anaconda.org/bioconda/lofreqconda install -c bioconda lofreq安装过程非常顺利。检验是否安装成功:lofreq屏幕显示:Fast and sensitive inference of SNVs and indels

2021-05-10 15:03:25 711

原创 实验记录 | Manta的安装

参考链接:https://github.com/Illumina/manta安装链接:https://github.com/Illumina/manta/blob/master/docs/userGuide/installation.md1。安装前的环境配置sudo apt-get update -qqsudo apt-get install -qq bzip2 gcc g++ make python zlib1g-dev2。下载并安装下载链接:https://github.com/Illumi

2021-05-10 14:48:05 917 1

原创 实验记录 | Shimmer的安装

参考链接:https://mybiosoftware.com/shimmer-detection-of-genetic-alterations-in-tumors-using-next-generation-sequence-data.htmlhttps://research.nhgri.nih.gov/software/Shimmer/download.shtmlhttps://github.com/nhansen/Shimmer1。搭建依赖环境安装R语言以及statmod包。因为之前已经安装

2021-05-08 20:43:56 425

原创 实验记录 | SpeedSeq安装

参考链接:https://github.com/hall-lab/speedseq下载安装包。git clone --recursive https://github.com/hall-lab/speedseqcd speedseqmakemake alignmake[1]: Entering directory ‘/home/zxx/workplace/speedseq’make -C src/bwamake[2]: Entering directory ‘/home/zxx/workp

2021-05-08 18:08:55 1546

原创 实验记录 | VarScan的安装

1。下载VarScan参考链接:http://varscan.sourceforge.net/#install-varscan从官网中找到VarScan的安装方式。首先,下载.jar文件。下载链接:https://sourceforge.net/projects/varscan/files/我选择,VarScan.v2.3.9.jar文件。下载之后,在文件夹下,运行:java -jar VarScan.v2.3.9.jar屏幕显示:VarScan v2.3USAGE: java -jar

2021-05-07 23:21:54 1110

原创 实验记录 | Strelka2安装

这次的安装比我想象中的要简单,只需要下载并解压即可运行。但是,我并不明白,在这样一个pipeline中,这个软件发挥着怎样的作用(是在bash代码中直接调用吗?)因此,我先初步的按照官网的介绍,安装。等到后面在pipeline中使用的时候,再一步步的分析代码。参考链接:安装:https://github.com/Illumina/strelka/blob/v2.9.x/docs/userGuide/quickStart.md使用:https://github.com/Illumina/strelk

2021-05-07 23:10:11 966

原创 实验记录 | Mutect的安装

参考链接:https://github.com/broadinstitute/mutect安装Mutect之前,需要先安装java 1.7以及Maven 3.0+。1。 环境配置首先检验一下系统中的java版本。java -versionjava version “1.8.0_181”下面,开始检索安装Maven。安装参考链接:https://blog.csdn.net/qq_29695701/article/details/90705181从官网下载Maven,下载地址:https:/

2021-05-07 10:52:39 769

原创 实验记录 | samtools的安装

由于canda直接安装samtools执行失败,本次选择手动编译安装最新版的samtools。1。下载samtools安装包。官网下载链接:https://github.com/samtools/samtools/releases/tag/1.12点击蓝色字体链接,下载tar.bz2格式的文件,源文件并不是很全。下载完成之后,将其保存在指定目录下,打开目录。解压缩文件夹。tar -jxvf samtools-1.12.tar.bz2cd samtools-1.12/执行configure这一

2021-05-06 22:11:20 3241

原创 实验记录 | conda的安装

很多生信软件都可以通过conda一键安装。所以,此次尝试使用conda安装samtools。总而言之,多配置一些程序总是不错的。不过conda是基于python平台的,所以,我在安装之前,先要安装python3。1。 安装python3.9本来打算事先下载好一系列的包,跟着教程一路傻瓜似的操作,安装了yum在ubuntu的系统上,后来查资料发现,yum在此系统上的应用有限,所以又卸载了。(14:55)了解到这一点之后,换用关键词“python3.9安装教程 ubuntu”继续搜索,找到一篇教程,决

2021-05-06 20:27:27 748

原创 实验记录 | Sambamba的安装

https://github.com/biod/sambamba/releases,在这个链接下。下载版本号为Sambamba 0.8.0的linux压缩包(https://github.com/biod/sambamba/releases/download/v0.8.0/sambamba-0.8.0-linux-amd64-static.gz)。我们下载的是编译后的文件,所以在使用的时候相对更简单。下载之后,解压文件夹。gunzip sambamba-0.8.0-linux-amd64-stati

2021-05-06 10:51:17 2778

原创 实验记录 | GATK的安装

GATK主要支持在linux平台/MacOS平台,window平台并不支持。因此下面的操作都在linux平台运行。参考链接:https://gatk.broadinstitute.org/hc/en-us/articles/360036194592-Getting-started-with-GATK41.下载GTAK并解压下载GATK的安装包。参考链接:https://software.broadinstitute.org/gatk/注意解压指令是unzip。unzip gatk-4.2.0.

2021-05-06 09:40:43 6759 1

原创 实验记录 | Picard的安装

实验记录1. java的安装java的解压sudo tar -zxvf jdk-8u181-linux-x64.tar.gz -C /usr/lib/jvmjava的环境变量的配置sudo vi ~\ bashnrc#set the jdk environmentexport JAVA_HOME=/usr/lib/jvm/jdk1.8.0_181export JRE_HOME=JAVAHOME/jreexportCLASSPATH=.:{JAVA_HOME}/jreexport CLAS

2021-05-06 08:43:30 5093

原创 文献阅读 | 基于单细胞RNA测序数据的谱系追踪

Overcoming Genetic Drop-outs in Variants-based Lineage Tracing from Single-cell RNA Sequencing Data文献链接:https://www.biorxiv.org/content/10.1101/2020.01.01.892562v1.full#page研究背景谱系追踪(lineage tracing)有哪些研究方法?低通量、侵入性的技术用染料或者放射性同位素标记细胞引入遗传因素高通量、非侵

2021-05-05 22:34:35 1417

原创 文献阅读 | 基于ATAC-seq数据的SNV与indels的发现

Discovering single nucleotide variants and indels from bulk and single-cell ATAC-seq文献链接:https://www.biorxiv.org/content/10.1101/2021.02.26.433126v1.full研究背景1、genetic variants的发现WGSATAC-seq特点成本高,大部分的reads来自非调控区、非编码区低成本,reads来自调控区(有功能的突变)

2021-05-05 22:30:06 529

原创 Error: Could not find tools necessary to compile a package/compilation failed for package

报错全文:WARNING: Rtools is required to build R packages, but is not currently installed.Please download and install Rtools 4.0 from https://cran.r-project.org/bin/windows/Rtools/.Downloading GitHub repo inmybrain/SClineager@HEADWARNING: Rtools is requi

2021-05-01 15:48:06 6315 3

annotation.txt

热图那篇文章用到的数据文件

2021-08-07

result_data.csv

热图那篇文章用到的数据文件

2021-08-07

邮件合并操作生成的模板.docx

这个文件是博客,邮件合并操作所得到的结果文件之一(1/2)。

2021-04-14

人事信息.xlsx

邮件合并操作博文中用到的xlsx文件。

2021-01-30

GSE98793.txt

本次实验使用的筛选差异表达基因原始数据文件 原始数据在GEO数据库中的ID号为GSE98793

2020-03-15

gene_list.txt

样本分类信息 你们可以按照自己的数据的性质 ,对样本分类信息进行个性化的调整。

2020-03-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除