自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 用limma包进行多组差异表达分析

写在前面:最近在使用limma包进行差异表达分析,参考了网上许多教程都觉得说的云里雾里,很不清楚。经过我自己一段时间非常痛苦的钻研,弄明白了,解决了我的实际需求。于是决定将我的分析经验写下来,分享给需要的人。首先加载前期预处理好的表达矩阵。(我的原始表达矩阵文件已附在文后,大家有需要可以下载实践)setwd("E://Rworkplace")data<-read.table...

2020-03-15 00:20:16 4679 4

原创 实验记录 | 梳理代码2

凡事预则立,不预则废。我就不相信我多下一点功夫会搞不定它。我一定要把它弄清楚。刚刚看到github上关于这个流程的讨论,对于作者佩服的不行。觉得只有更加的努力,才能在这个领域有自己的一席之地。想想看已经有学弟比自己厉害了。既然学弟可以顺利的跑下来,那么我想,我也可以。我想成为这个领域最厉害的那20%。进阶之路真的是永无止境啊。这篇文章,我打算梳理一下github上,ORBC pipeline的框架。都主要有哪一些的文件。并且每一个文件的意思是什么?那个学弟之所以可以与作者“对话”,主要原因还是细致.

2021-05-16 21:44:33 2

原创 实验记录 | somatic.pl的运行3

接2的程序,又报了一系列的错误,我们再次整理。ERROR MESSAGE: Unable to retrieve resultERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor/tumor_intervals.list because The interval file does not exist.ERROR MESSAGE: Could not read file /home/zxx/QBRC/human/tumor

2021-05-16 21:42:57 5

原创 经验总结 | 建索引的五种方式

最近真的是遇到了各种类型的索引,所以觉得有必要总结一下。bowite索引bwa索引dict索引fai索引最后我将这些索引,上传到百度网盘中,以备不时之须。hg19因为构建索引的过程实在是太耗功夫了。所以很有必要及时的备份。另外,我觉得我的移动硬盘马上就要到了,我要把ORBC的分析流程移动到硬盘上去弄,到时候只需要调用绝对路径即可。...

2021-05-16 18:09:04 5

原创 实验记录 |somatic.pl的运行2

一个同学分享了一个网盘文件,上面有gatk相关的文件,所以我尝试下载,是否能够使用。参考链接:https://blog.csdn.net/xxxie_/article/details/100111991我的心态是崩的,原来早就有同学分享到网盘里了。我也有匆匆浏览过这个网页,但是没有注意到它在文后的一个分享。还是要静下来去做事吧!...

2021-05-15 15:09:47 6

原创 实验记录 | 梳理代码1

参考链接:https://github.com/tianshilu/QBRC-Somatic-Pipeline1。job_somatic.pl这个代码文件,实际上是前面介绍的somatic.pl的衍生物。适用的情况是对多个fastq文件进行somatic.pl批处理。也即文件多了一点罢了。需要提前写好文件(somatic_design.txt)。文档中包括:数据文件的地址、输出的文件夹、物种~/seq/1799-01N.R1.fastq.gz ~/seq/1799-01N.R2.f.

2021-05-14 20:38:53 20

原创 实验记录 | 阶段性汇报1

链接:https://gatk.broadinstitute.org/hc/en-us/articles/360035531652-FASTA-Reference-genome-format

2021-05-13 22:41:25 6

原创 实验记录 | somatic.pl运行1

1。ORBC mutation pipeline参考链接:https://github.com/Somatic-pipeline/QBRC-Somatic-Pipeline/tree/master/example/example_dataset/sequencing.输入数据流程输入文件的格式:fastq文件或者bam文件,或者两者的混合。测试数据:https://github.com/Somatic-pipeline/QBRC-Somatic-Pipeline/tree/master/

2021-05-13 22:35:55 15

原创 实验记录 | 梳理关键结果

【大纲】基本素材:(1)文献:https://www.biorxiv.org/content/10.1101/2020.01.01.892562v1.full(2)ORBC的处理流程:https://github.com/tianshilu/QBRC-Somatic-Pipeline今天下午要完成的事情:(1)根据文献理明白,文献分析10X的数据,得到的关键结果是什么?(2)下载实验数据,数据的背景(研究什么问题)是什么?弄清楚实验分析从哪一处的数据开始?(3)梳理ORBC处理流程,开始运.

2021-05-13 09:58:53 6

原创 实验记录 | STAR的安装

下载source包。https://github.com/alexdobin/STAR/archive/refs/tags/2.7.9a.tar.gz解压到指定文件夹下。tar -zxvf STAR-2.7.9a.tar.gzcd STAR_2.7.9acd sourcemake STAR同样的,配置环境变量。STAR指令在bin文件夹下的Linux_x86_64内。sudo vi ~/.bashrcexport PATH=/home/zxx/workplace/STAR/bin/Li

2021-05-11 15:07:10 15

原创 实验记录 | BWA的安装

官网简介:http://bio-bwa.sourceforge.net/BWA is a software package for mapping low-divergent sequences against a large reference genome, such as the human genome. It consists of three algorithms: BWA-backtrack, BWA-SW and BWA-MEM. The first algorithm is desig

2021-05-11 14:21:17 9

原创 实验记录 | bowite2安装

我首先使用conda进行安装,但是最后出现了与samtools相似的问题,于是,现在直接下载软件包。https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.4.2/从列表中选择适用于linux系统的软件包(linux-x86_64)。解压。unzip bowtie2-2.4.2-linux-x86_64.zip配置环境变量。sudo vi ~/.bashrc在文件中添加bowite2的系统安装路径:export PATH="/

2021-05-10 16:51:18 13

原创 实验记录 | Annoar的安装

https://www.openbioinformatics.org/annovar/annovar_download_form.php在这个链接中下载软件,只不过需要教育类的邮箱。然而,我已经毕业了,刚刚看了一下苏大邮箱过期了,悲剧。下载链接:http://www.openbioinformatics.org/annovar/download/0wgxR2rIVP/annovar.latest.tar.gz...

2021-05-10 16:26:19 15 1

原创 实验记录 | Lofreq的安装

参考链接:http://csb5.github.io/lofreq/这篇文章中有介绍若干安装lofreq的方法,其中使用conda安装则最为简单,因此,本文使用conda进行Lofreq的安装。参考链接:https://anaconda.org/bioconda/lofreqconda install -c bioconda lofreq安装过程非常顺利。检验是否安装成功:lofreq屏幕显示:Fast and sensitive inference of SNVs and indels

2021-05-10 15:03:25 17

原创 实验记录 | Manta的安装

参考链接:https://github.com/Illumina/manta安装链接:https://github.com/Illumina/manta/blob/master/docs/userGuide/installation.md1。安装前的环境配置sudo apt-get update -qqsudo apt-get install -qq bzip2 gcc g++ make python zlib1g-dev2。下载并安装下载链接:https://github.com/Illumi

2021-05-10 14:48:05 20 1

原创 实验记录 | Shimmer的安装

参考链接:https://mybiosoftware.com/shimmer-detection-of-genetic-alterations-in-tumors-using-next-generation-sequence-data.htmlhttps://research.nhgri.nih.gov/software/Shimmer/download.shtmlhttps://github.com/nhansen/Shimmer1。搭建依赖环境安装R语言以及statmod包。因为之前已经安装

2021-05-08 20:43:56 7

原创 实验记录 | SpeedSeq安装

参考链接:https://github.com/hall-lab/speedseq下载安装包。git clone --recursive https://github.com/hall-lab/speedseqcd speedseqmakemake alignmake[1]: Entering directory ‘/home/zxx/workplace/speedseq’make -C src/bwamake[2]: Entering directory ‘/home/zxx/workp

2021-05-08 18:08:55 14

原创 实验记录 | VarScan的安装

1。下载VarScan参考链接:http://varscan.sourceforge.net/#install-varscan从官网中找到VarScan的安装方式。首先,下载.jar文件。下载链接:https://sourceforge.net/projects/varscan/files/我选择,VarScan.v2.3.9.jar文件。下载之后,在文件夹下,运行:java -jar VarScan.v2.3.9.jar屏幕显示:VarScan v2.3USAGE: java -jar

2021-05-07 23:21:54 19

原创 实验记录 | Strelka2安装

这次的安装比我想象中的要简单,只需要下载并解压即可运行。但是,我并不明白,在这样一个pipeline中,这个软件发挥着怎样的作用(是在bash代码中直接调用吗?)因此,我先初步的按照官网的介绍,安装。等到后面在pipeline中使用的时候,再一步步的分析代码。参考链接:安装:https://github.com/Illumina/strelka/blob/v2.9.x/docs/userGuide/quickStart.md使用:https://github.com/Illumina/strelk

2021-05-07 23:10:11 26

原创 实验记录 | Mutect的安装

参考链接:https://github.com/broadinstitute/mutect安装Mutect之前,需要先安装java 1.7以及Maven 3.0+。1。 环境配置首先检验一下系统中的java版本。java -versionjava version “1.8.0_181”下面,开始检索安装Maven。安装参考链接:https://blog.csdn.net/qq_29695701/article/details/90705181从官网下载Maven,下载地址:https:/

2021-05-07 10:52:39 8

原创 实验记录 | samtools的安装

由于canda直接安装samtools执行失败,本次选择手动编译安装最新版的samtools。1。下载samtools安装包。官网下载链接:https://github.com/samtools/samtools/releases/tag/1.12点击蓝色字体链接,下载tar.bz2格式的文件,源文件并不是很全。下载完成之后,将其保存在指定目录下,打开目录。解压缩文件夹。tar -jxvf samtools-1.12.tar.bz2cd samtools-1.12/执行configure这一

2021-05-06 22:11:20 41

原创 实验记录 | conda的安装

很多生信软件都可以通过conda一键安装。所以,此次尝试使用conda安装samtools。总而言之,多配置一些程序总是不错的。不过conda是基于python平台的,所以,我在安装之前,先要安装python3。1。 安装python3.9本来打算事先下载好一系列的包,跟着教程一路傻瓜似的操作,安装了yum在ubuntu的系统上,后来查资料发现,yum在此系统上的应用有限,所以又卸载了。(14:55)了解到这一点之后,换用关键词“python3.9安装教程 ubuntu”继续搜索,找到一篇教程,决

2021-05-06 20:27:27 22

原创 实验记录 | Sambamba的安装

https://github.com/biod/sambamba/releases,在这个链接下。下载版本号为Sambamba 0.8.0的linux压缩包(https://github.com/biod/sambamba/releases/download/v0.8.0/sambamba-0.8.0-linux-amd64-static.gz)。我们下载的是编译后的文件,所以在使用的时候相对更简单。下载之后,解压文件夹。gunzip sambamba-0.8.0-linux-amd64-stati

2021-05-06 10:51:17 16

原创 实验记录 | GATK的安装

GATK主要支持在linux平台/MacOS平台,window平台并不支持。因此下面的操作都在linux平台运行。参考链接:https://gatk.broadinstitute.org/hc/en-us/articles/360036194592-Getting-started-with-GATK41.下载GTAK并解压下载GATK的安装包。参考链接:https://software.broadinstitute.org/gatk/注意解压指令是unzip。unzip gatk-4.2.0.

2021-05-06 09:40:43 42

原创 实验记录 | Picard的安装

实验记录1. java的安装java的解压sudo tar -zxvf jdk-8u181-linux-x64.tar.gz -C /usr/lib/jvmjava的环境变量的配置sudo vi ~\ bashnrc#set the jdk environmentexport JAVA_HOME=/usr/lib/jvm/jdk1.8.0_181export JRE_HOME=JAVAHOME/jreexportCLASSPATH=.:{JAVA_HOME}/jreexport CLAS

2021-05-06 08:43:30 39

原创 文献阅读 | 基于单细胞RNA测序数据的谱系追踪

Overcoming Genetic Drop-outs in Variants-based Lineage Tracing from Single-cell RNA Sequencing Data文献链接:https://www.biorxiv.org/content/10.1101/2020.01.01.892562v1.full#page研究背景谱系追踪(lineage tracing)有哪些研究方法?低通量、侵入性的技术用染料或者放射性同位素标记细胞引入遗传因素高通量、非侵

2021-05-05 22:34:35 4

原创 文献阅读 | 基于ATAC-seq数据的SNV与indels的发现

Discovering single nucleotide variants and indels from bulk and single-cell ATAC-seq文献链接:https://www.biorxiv.org/content/10.1101/2021.02.26.433126v1.full研究背景1、genetic variants的发现WGSATAC-seq特点成本高,大部分的reads来自非调控区、非编码区低成本,reads来自调控区(有功能的突变)

2021-05-05 22:30:06 5

原创 Error: Could not find tools necessary to compile a package/compilation failed for package

报错全文:WARNING: Rtools is required to build R packages, but is not currently installed.Please download and install Rtools 4.0 from https://cran.r-project.org/bin/windows/Rtools/.Downloading GitHub repo inmybrain/SClineager@HEADWARNING: Rtools is requi

2021-05-01 15:48:06 32

原创 typora编辑器运行变慢?

最近在用typora写笔记,今天下午输入的时候(非源代码模式),运行非常的慢。主要表现为,输入一个词或者作出什么删除等操作,都要反应半天。我以为是自己的电脑内存不行,后来用任务管理器关闭几个后台运行的应用,重启typora仍然不能解决问题。后来通过检索,发现一篇文章,https://www.zhihu.com/question/47414134 。我才明白不是我一个人存在这样的问题。于是接受建议,在源代码模式下编写,输入速度上有改进。...

2021-04-30 13:14:48 24

原创 载入了名字空间‘cli’ 2.3.0,但需要的是>= 2.4.0

简单理解一下报错语句的意思就是载入的cli包的版本是2.3.0,但是实际要求的包的版本是2.4.0。两者之间并不匹配,产生冲突,于是在运行的过程中报错。那这个时候,我预想的解决方法就是,更新cli包。搜索包更新的方法ing……install.packages("cli")更新了一下cli包,RStudio上屏显为:trying URL 'https://cran.rstudio.com/bin/windows/contrib/4.0/cli_2.5.0.zip'Content ty

2021-04-29 22:17:57 52

原创 文献阅读 | 利用体细胞的mtDNA的突变追踪细胞的分化命运

文献来源:https://doi.org/10.1016/j.cell.2019.01.0221、为什么用体细胞的mtDNA的突变而不用体细胞的核基因的突变?体细胞的核基因突变具有较高的错误率(high error rates),有限的规模(limited scale),以及并不能有效的捕捉细胞状态信息(cell state information)。2、ATAC-seq与Chip-seq的区别是什么?ATAC-seq(assay for transposase accessible c.

2021-04-26 22:11:11 22

原创 Python模块学习之optparse

前言:之前分析前辈的代码的时候,遇到过一长串的引用optparse模块的操作,有点看不懂,于是进一步学习这个模块的作用。optparse模块为Python自带,在使用的过程中直接import。主要的作用是自定义软件提交的参数,可联想我们平时用到的一些软件只需要提交一系列参数进行命令行操作即可,原理类似。1、导入optparse模块。from optparse import OptionParser #导入库2、新建一个对象。optParser =OptionParser(u...

2021-04-19 22:32:06 14

原创 Python模块学习之Matplotlib(简单绘图)

参考链接:https://github.com/MurphyWan/Python-first-Practice/blob/master/D2_of_3Day_DoneWithPython.md最近在看一个前辈的代码,发现她用了这个库进行数据处理的操作。刚开始的时候是有点看不懂的,就尝试着学习一下这个包,争取能够看懂前辈的代码。1、导入matplotlib模块from matplotlib import pyplot as pltmatplotlib/pyplot/plt的关系是什..

2021-04-19 12:50:26 33

原创 全国计算机等级考试二级教程——Python语言程序设计(2018年版)课后习题参考答案汇总

如标题所示,由于嵩天老师的那本书的课后习题的大题部分缺少答案,于是下面的代码是自己在看书期间尝试练习的结果,仅供同学参考。另外推荐MOOC上嵩天老师关于Python的在线课程。祝学习愉快。#第2章第2题sen=input("请输入一段文字:")print("\n".join(sen)) #在print函数中,“\n”的转义效果就很明显#把一个字符串拆分成由字符组成的列表【不能变成集合,因为集合的话会自动去重】的话是不是直接list()list1=list(sen)#第2章第3题 ..

2021-04-18 14:46:46 53

原创 Python模块学习之NumPy(数组的使用)

NumPy提供了一种新的数据类型:多维数组。数组只能够存储相同的数据类型(如字符型,数值型)。1、使用import关键词导入NumPy模块

2021-04-18 14:19:29 77 1

原创 关于计算思维的一些没有逻辑的心得

算法是解决问题的方法,比如将10个数按照从小到大的顺序排列,应该怎样去比较?这时,针对于同一个问题会想出不同的解决方案。算法其具体来说,就是一种操作步骤,如打开冰箱,把大象塞到冰箱,关闭冰箱的门。他是有顺序的,并且这一系列的动作组合起来,能够完成一个整体的目标——将大象塞进冰箱。那么这里涉及更具体的——模块化的思维。就是我们在写代码的过程中,不要着急一下子就能够解决问题,而是要去想,如何将大的目标,拆分成具体可执行的步骤,然后再分别的用每一个模块实现,最终将各个部分有机的组合衔接,实现我们整个项目的

2021-04-17 15:13:21 32

原创 RNA-seq的典型流程(protocol)

一、RNA的分离从新鲜的或者是冷冻的细胞或组织样本中分离RNA,一般情况下,样品会被DNA污染。因此,在制备文库之前,会使用DNA酶(降解DNA)降解RNA样品中的DNA污染。二、RNA的质量检查(在后续分析的时候也有质控这一步,不过是从测序质量这个层面的质量)在制备文库之前,要在RNA降解,纯度和数量上对RNA进行质量检查。三、文库制备由于DNA相较于RNA有更好的稳定性,所以在测序前,需要将RNA转化为cDNA。RNA-seq常用的illumina平台的文库制备流程:(1

2021-03-30 17:25:23 94

原创 RNA-seq数据上游分析流程(从原始数据开始)

数据分析的基本思路(1)从ncbi的geo或者其它数据库中查找自己感兴趣的RNASeq数据,至少要求给出如下信息:该套数据所发表的文章的名字:该套数据的下载网址:该套数据基本情况介绍(简介以及该套数据包含多少个样本,分为多少种类型,以及每种类型有多少个样本)(2)对芯片数据进行质量控制评价及处理(如果质量差的话,每个样本都应该处理), 可以用软件Fastqc+Trimmomatic配合使用,也可以用其它软件替换(3)用TopHat2 + Cufflinks+Hisat系列软件进.

2021-03-25 13:12:22 495

原创 单细胞分析之标准化处理

书籍原始链接:https://www.bioconductor.org/books/release/OSCA/normalization.html本篇笔记根据书中介绍的内容,按照自己的实际操作情况,进行复现和重新整理。为什么要做标准化?要解决什么样的问题?进一步消除细胞之间的系统差异(我们前面做质控分析,其实也涉及到这一点),使得后面在比较细胞之间的表达量的时候,这种差异主要来源于生物条件的不同,而非是一些实验过程中的系统误差。补充小知识点1:标准化与批次校正的区别标准化:不管批次结构,.

2021-03-12 13:28:17 213

原创 单细胞测序之质控分析(QC)

一、为什么要做质控?在细胞分离过程中的细胞损伤或者文库制备的失败(无效的逆转录或者PCR扩增失败),往往会引入一些低质量的数据。这些低质量的数据的主要特点是:细胞整体上的counts值少(列)基因的低表达(行)线粒体基因或者spike-in的比例相对较高如果这些损伤的行或者列,没有被移除的话,可能会对下游的分析结果产生影响。所以我们在进行分析之前,一定要率先移除这些低质量的行与列。(一开始的理解,后面整个流程做完之后,或许理解会更多,那么接下来在做详细的补充)二、质控的基本流程1、测试数据

2021-03-10 20:50:38 325

邮件合并操作生成的模板.docx

这个文件是博客,邮件合并操作所得到的结果文件之一(1/2)。

2021-04-14

尊敬的张三先生.docx

博客邮件合并操作生成的结果文件之一(2/2)

2021-04-14

人事信息.xlsx

邮件合并操作博文中用到的xlsx文件。

2021-01-30

gene_list.txt

样本分类信息 你们可以按照自己的数据的性质 ,对样本分类信息进行个性化的调整。

2020-03-15

GSE98793.txt

本次实验使用的筛选差异表达基因原始数据文件 原始数据在GEO数据库中的ID号为GSE98793

2020-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除