自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

垚垚爸的博客

记录一个老菜鸟的自学心得

  • 博客(54)
  • 收藏
  • 关注

原创 联合分析操作记录-2021-05-10: zhaoyingying_project

启动相关环境条件Last login: Thu May 6 21:03:39 2021 from 218.68.219.32zexing@DNA:~$ source .bashrc(base) zexing@DNA:~$ cd projects/zhaoyingying/ChIP_seq(base) zexing@DNA:~/projects/zhaoyingying/ChIP_seq$ lltotal 12Kdrwxrwxr-x 3 zexing zexing 4.0K 5月 1 10

2021-05-11 17:39:24 1192 1

原创 记录一个奶爸从零学习生信的点滴

缘起早就过了而立之年的我,今年引来了人生的又一个大的变动,于是自己开始学习生信尝试转行。没有了少年时的昂扬斗志,更多的是彷徨、无措,无奈,生活要继续。无意中找到了这个CSDN网站,几次学习后收获颇多,为了督促自己学习决心开始写博客,记录自己的学习心得。入门从同事那里问了以后工作大概需要使用的软件,从大学同学那里咨询了如何入门,在网上买了《鸟哥的Linux私房菜》学习基础,开始了一个老菜鸟的学习之路。对生信没有一点概念,所以从知乎上找了一篇《如何自学入门生物信息学》,准备按照这个来开始自己的学习之路吧

2020-05-15 15:32:56 818 2

原创 RNA病毒基因组的重头组装-内含tophat2报错的快速解决办法-CPIV3数据分析-2023-07-13

vim新建RNA_seq_script_1对CPIV3测序数据进行质控分析。

2023-07-15 10:11:52 489

原创 RNA-seq流程学习笔记(18)- Heatmap图

利用R包进行heatmap绘图,包括基因集的提取、格式转换,FPKM值提取、保存,热图的绘制等

2022-11-27 09:31:38 2059 1

原创 操作记录-2022-09-12: xieruyu_project

鸡的转录基因组分析

2022-09-12 10:27:09 758

原创 xindi-2022-08-23数据分析记录

RNA-Seq测序检测不同RNA的种类、数量和比例

2022-08-24 12:54:20 486

原创 xindi数据分析记录

1、 使用FastQC软件对数据进行质控检测fastqc -t 16 -o ${dir}/fastqc_report/ ${dir}/clean_data/*.fq.gz2、 使用Trim Galore软件对三组数据进行质控,去掉20bp以下的reads1.对HeLa细胞数据进行处理trim_galore -q 20 --phred33 --stringency 3 --length 20 -e 0.1 -j 16 --paired /Data/lizexing/projects/xindi/Da

2022-03-05 11:15:02 832

原创 2021-08-04

Ribosome RNA数据库下载:https://www.arb-silva.de/did you try sortMeRNA? The input are reads in fastq file + rRNA sequences. The tool will extract those reads that do not match to the rRNA sequences, so by quantifying how many reads you’re left with, you should

2021-08-25 15:01:39 1984 1

原创 批量下载NCBI各种数据的方法集合

NCBI批量下载数据,省时又省力ncbi-api 1.0NCBI Genome Downloading ScriptsNCBI accession download script

2021-07-16 16:42:30 3977

原创 2021-07-14:sunruiqi_RNA_seq

今天准备尝试编写一组精简代码用于处理RNA_seq数据,希望能成功吧。1.建立相应目录对新数据建立对应实验人员(sunruiqi)、测序类型(RNA_seq)和日期(2021_07_14)的目录。# 建立后如下:(base) zexing@bio:~/projects/sunruiqi/RNA_seq/2021_07_14$# 新建对应的目录mkdir raw_data clean_data ballgown bam bam_sort sam fastqc_report GSEA MD5_tx

2021-07-15 11:43:42 522

原创 联合分析操作记录-2021-05-14: sunxiaoyu_project

一、ChIP_seq 数据加工处理1.建立相应目录对新数据建立对应实验人员(sunxiaoyu)、测序类型(ChIP_seq)和日期(2021_05_14)的目录。# 建立后如下:(base) zexing@DNA:~/projects/sunxiaoyu/ChIP_seq/2021_05_14$# 新建对应的目录mkdir raw_data clean_data bam bam_bw bam_sort sam macs2_bdgdiff macs2_callpeak matrix_refer

2021-05-14 20:53:17 503

原创 操作记录-2021-02-22: kongyu_project

1.建立相应目录对新数据建立对应实验人员(kongyu)、测序类型(RNA_seq)和日期(2021_02_22)的目录。# 建立后如下:(base) zexing@DNA:~/projects/kongyu/RNA_seq/2021_02_22$# 新建对应的目录mkdir raw_data clean_data ballgown bam bam_sort sam fastqc_report GSEA MD5_txt scripts_log2.检查数据完整性(base) zexing@

2021-05-10 10:45:22 155

原创 CHIP-seq流程学习笔记(13)-ATAC_seq 数据加工处理

今天第一次尝试处理ATAC_seq数据,希望能尽快做完吧。先放个找好的参考文章:ATAC-seq/ChIP-seq分析方法1.建立相应目录对新数据建立对应实验人员(zhaoyingying)、测序类型(ATAC_seq)和日期(2021_05_03)的目录。# 建立后如下:(base) zexing@DNA:~/projects/zhaoyingying/ATAC_seq/2021_05_03$# 新建对应的目录mkdir raw_data clean_data bam bam_bw bam

2021-05-10 10:37:49 1271 1

原创 CHIP-seq流程学习笔记(9)-使用IDR 软件对生物学重复样本间的差异peak进行提取

使用IDR软件处理生物学重复样本的peak callingIrreproducible Discovery Rate (IDR)

2021-05-10 09:30:17 5666

原创 操作记录-2021-05-08: daizhongye_project

一、ChIP_seq 数据加工处理1.建立相应目录对新数据建立对应实验人员(daizhongye)、测序类型(ChIP_seq)和日期(2021_05_08)的目录。# 建立后如下:(base) zexing@DNA:~/projects/daizhongye/ChIP_seq/2021_05_08$# 新建对应的目录mkdir raw_data bam bam_bw bam_sort sam macs2_bdgdiff macs2_callpeak matrix_reference_poin

2021-05-09 08:50:18 284

原创 RNA-seq流程学习笔记(5)-Linux系统下载UCSC人类基因组和基因注释文件(未完成)

主要参考文章:基因组各种版本对应关系测试数据及参考基因组的准备RNA-seq(4):下载参考基因组及基因注释下载参考基因组的原因我们测序得到的是几百bp的短read(具体长短还有差异?需要进一步学习), 相当于把拼图打散了给你。如果没有参考基因组,从头(de novo)组装等于是重走人类基因组计划的老路,也就是打散了拼图,却不告诉你原来是什么样子,那么任务将会及其艰巨。目前人类基因组已经组装好了,我们只需要把我们测得序列回贴(mapping)回去,毕竟人与人之间的差距只有不到1%差异, 允许mi

2021-03-25 09:30:27 3191

原创 RNA-seq流程学习笔记(17)- PCA图聚类分析

#绘制PCA图#需要使用各组的FPKM进行绘制#对FPKM数据进行整理#清空环境变量rm(list=ls())##将StringTie分析得到的含有FPKM数据的TAB文件导入当前工作环境中#设置工作目录setwd("G:/kongyu/RNA-seq/2021_02_22/gene_tab/")DIPG4_1_1.gene.tab <- read.table("G:/kongyu/RNA-seq/2021_02_22/gene_tab/DIPG4_1_1.gene.tab",

2021-03-25 09:18:49 7885

原创 操作记录-2021-03-04: sunxiaoyu_project

检查数据完整性(base) zexing@DNA:~/projects/sunxiaoyu/RNA_seq/2021_03_04$ cat md5.txt > check_md5sum.txt && md5sum -c check_md5sum.txt./clean/sh4A_2_8_2.clean.fq.gz: OK./clean/shP2_2_4_2.clean.fq.gz: OK./clean/shP2_4_2.clean.fq.gz: OK./clean/shKA_1

2021-03-15 13:07:23 313 1

原创 操作记录-2021-03-15: sunxiaoyu_project

1、数据处理记录【1】使用网页另存为将数据文件保存至本地电脑后,上传至服务器中【2】利用SRAtoolkits中的fastq-dump命令,将SRA数据转换为fastq格式#命令如下:(base) zexing@DNA:~/projects/sunxiaoyu/RNA_seq/2021_03_15/clean_data$ fastq-dump --split-e SRR11906971 SRR11906972 SRR11906973 SRR11906974Read 27386449 spots f

2021-03-15 10:52:23 277

原创 CHIP-seq流程学习笔记(12)-对特定gene使用bedtools getfasta后,用meme软件进行motif分析

刚写题目时发现,现在的分析应该是RNA-seq与ChIP-seq杂合在一起的分析了,为了省事还接着在这个系列写吧。最近有站友发私信建议说把代码跑出来的结果放上,方便学习。这里说明一下:关于学习笔记我尽量把图片放上来,对于分析的记录,因为涉及到实验室的课题,为了避免不必要的麻烦就不放了,本意这个记录就是自己的试验记录,记录下代码过程,为以后学生发表文章参考。1. 根据gene_list从hg19_genes.gtf文件中提取gene_TSS信息也可以使用biomaRt包进行注释,中间出错尚未解决,有机会再

2021-01-13 11:51:48 4054 3

原创 操作记录-2021-01-07: lizexing_future_project

一.分析之前发表文章(1)1、相关研究样品的背景Study: RNA Sequencing Analysis of Mouse Bone Marrow Derived Dendritic Cells Transcriptomes During MaturationSample: mDC_RNAseq SAMN02981600 • SRS678226 • All experiments • All runsOrganism: Mus musculus2、数据处理记录【1】使用网页另存为将数据文件

2021-01-07 11:54:50 257

原创 操作记录-2020-12-21: dongfeng_GAS_project

今天老菜鸟接了实验室一个大活,要帮学生把一个课题结掉,因此需要处理三批次数据。当然了,老菜鸟这些天正在忙一些其他事情,不知道这些事情有了结果后,还会不会再继续这些工作了,暂且记录一下自己目前复杂的心情吧。1. 建立相应目录# 新建对应的目录mkdir raw_data clean_data ballgown bam bam_sort sam fastqc_report GSEA MD5_txt scripts_log2. 检查数据完整性这次将提供的md5.txt中数据提前编辑了一下,修改了样品

2021-01-04 16:08:20 987

原创 CHIP-seq流程学习笔记(11)-使用GSEA软件进行GSEA分析

参考文章:GSEA学习笔记老菜鸟做了几次GSEA分析,现在还没完全搞明白,之前写的记录有些杂乱,这里重新整理一下,以便以后学习。1.使用GSEA软件进行绘图需要准备的文件。该分析需要使用三个输入文件,分别是:geneset文件:格式为.gmx,我经常用到的是自定义的,本次记录中使用的是ChIP-seq中鉴定出来的peak所对应的gene。gene表达值文件:格式为.txt,本次用到的是RNA-seq中各样品的表达值FPKM;分组信息:格式为.cls,一般自己制作,对分组、样品信息进行说明。2.

2021-01-04 16:02:24 1911

原创 操作记录-2020-11-13:精简代码处理ChIP_seq数据

今天准备尝试编写一组精简代码用于处理ChIP_seq数据,希望能成功吧。1.建立相应目录对新数据建立对应实验人员(lizexing)、测序类型(ChIP_seq)和日期(2020_11_13)的目录。# 建立后如下:(base) zexing@DNA:~/projects/lizexing/ChIP_seq/2020_11_13$# 新建对应的目录mkdir raw_data clean_data bam bam_bw bam_sort sam macs2_bdgdiff macs2_call

2020-11-16 11:30:47 2127 2

原创 操作记录-2020-11-08:精简代码处理RNA_seq数据

今天准备尝试编写一组精简代码用于处理RNA_seq数据,希望能成功吧。1.建立相应目录对新数据建立对应实验人员(lizexing)、测序类型(RNA_seq)和日期(2020_10_20)的目录。# 建立后如下:(base) zexing@DNA:~/projects/lizexing/RNA_seq/2020_11_08$# 新建对应的各级目录mkdir raw_data clean_data ballgown bam bam_sort sam fastqc_report GSEA MD5_

2020-11-08 10:01:43 2922

原创 CHIP-seq流程学习笔记(10)-使用intersect()函数提取ChIP-seq和RNA-seq中的共有基因

参考文章:R中常用函数使用说明# 利用intersect函数对RNA_seq和ChIP_seq中的交集gene_symbol进行提取。# 参考文章:https://blog.csdn.net/woodcorpse/article/details/80494605?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160471856319195264746932%2522%252C%2522scm%2522%253A%252220140713.

2020-11-07 22:50:03 774

原创 CHIP-seq流程学习笔记(8)-使用MACS2 bdgdiff提取非生物学重复样本间差异peak进行注释

参考文章:使用MACS2进行差异peak分析重点推荐:Call differential binding eventsMACS2作为使用最广泛的peak calling软件,在v2版本中添加了差异peak分析的功能,它的子命令功能如下:1. 软件说明# 用法说明:usage: macs2 bdgdiff [-h] --t1 T1BDG --t2 T2BDG --c1 C1BDG --c2 C2BDG [-C CUTOFF] [-l MINLEN] [-

2020-11-06 20:13:57 8683 5

原创 操作记录-2020-11-03:daizhongye_ChIP_seq

1. 检查上传数据的完整性操作记录如下:#将各样品测序结果整理至同一个文件夹#显示各样品的数据的完整性代码(base) zexing@DNA:~/projects/daizhongye/ChIP_seq/2020_10_29$ cat *.txtf06dbfdc620f99f9aea8882c3c1c0701 Scr-S-L-KQ_FKDL202604880-1a_1.clean.fq.gz3047a0aa4febe0c311aa34126e0ed416 Scr-S-L-KQ_FKDL202

2020-11-05 16:05:29 594 4

原创 操作记录-2020-10-30:daizhongye_RNA_seq

隔了一个月又来操作一次,老菜鸟的脑子明显不够用啊。1. 检查上传数据的完整性操作记录如下:#显示各数据的完整性代码(base) zexing@DNA:~/projects/daizhongye/RNA_seq/2020_10_29/MD5_txt$ cat md5.txtefcc57e9ff0bd5c3f4a04dcd01513903 raw/E14_Scr_SL_1.fq.gz657fe81df85e0f3c246c3bcfbc07a4c3 raw/E14_Scr_SL_2.fq.gz5

2020-10-30 15:49:52 4504

原创 操作记录-2020-09-27:xiaxianyou_RNA_seq

1. 检查上传数据的完整性操作记录如下:#显示各数据的完整性代码(base) zexing@DNA:~/projects/xiaxianyou/RNA_seq/2020_09_23/cleandata$ cat *.txtea24c0a81c3b146f52180d03fb387f54 s4301_FKDL202588235-1a_1.clean.fq.gz44e7699dc34c62f7947e4288ea1f0f72 s4301_FKDL202588235-1a_2.clean.fq.gz

2020-09-27 15:06:54 1096

原创 R中常用函数使用说明——持续更新

参考文章:(参见各标题链接)老菜鸟最近进入了R的学习中,看的书籍用不上,使用时候还得满网到处去搜集各种说明,唉,累啊,写个R中各种命令的说明,方便自己查找学习吧。1. 提取不同列的内容组成新变量——常用于分组信息的设置#提取指定列的内容#对数据中的Gene.ID和FPKM两列数据进行提取m3108.FPKM <- m3108.gene.tab[,c(1,8)]2. 重命名指定列名#重命名全部的列names(data) <- c("NO","name")#重命名单个列col

2020-09-22 16:22:45 4899

原创 CHIP-seq流程学习笔记(7)-热图软件 deeptools

5.使用deeptools对结果进行作图deepTools 是一套基于python开发的工具,适用于有效处理分析高通量测序数据,可用于ChIP-seq, RNA-seq 或 MNase-seq。需要在Linux服务器上,使用conda进行安装。deepTools包含许多可用工具,在使用时,需要单独调用它自己的名字。1. 各工具的介绍如下:[ Tools for BAM and bigWig file processing ]multiBamSummary compute read

2020-09-22 16:22:02 12804

原创 CHIP-seq流程学习笔记(6)-peak注释软件ChIPseeker

参考文章:Y叔叔公众号我的第一次ChIP-seq实践学习一遍ChIPseeker的使用使用R包ChIPseeker实现对ChIP-seq peaks的注释1. 输入数据的说明作了ChIP-seq试验,经过初步下机处理并比对参考基因组之后,获得了目标蛋白在基因组区域的结合峰位置。接下来就需要对峰位置进行注释,获得这些峰结合在了哪些基因上,位于基因的上下游还是内部,以便了解目标蛋白的功能。对ChIP-seq峰的结合位置进行注释需要使用上面peak calling产生的结果中的bed文件。bed

2020-09-22 16:18:03 7832 6

原创 CHIP-seq流程学习笔记(3)-比对软件 bowtie2

参考文章:我的第一次ChIP-seq实践bowtie2使用手册老菜鸟终于开始进行CHIP-seq的学习啦,又是开始学习新的软件。不过现在感觉没那么头大了,毕竟前边学了一些了。先做些简单的记录吧。1.安装Bowtie2软件安装仍然在服务器中使用miniconda进行安装,参考文章RNA-seq流程学习笔记(3)。2.Bowtie2软件软件的使用1. 软件说明bowtie2 --helpUsage: bowtie2 [options]* -x <bt2-idx> {-1 &lt

2020-09-22 16:13:41 3386 2

原创 CHIP-seq流程学习笔记(4)-call peak 软件macs2

参考文章:MACS2 Call Peak 参数详细学习1. 软件说明:macs2 callpeak --helpusage: macs2 callpeak -t TFILE # treat组 [-c [CFILE]] # control 或 mock(非特异性抗体,如IgG)组 # control:input DNA,没有经过免疫共沉淀处理;

2020-09-22 16:11:08 4608 2

原创 RNA-seq流程学习笔记(16)-Linux系统下完整流程代码

1.关于准备工作2.3.FastQC流程代码4.Hisat2流程代码#! /bin/bash#上面一行宣告这个script的语法使用bash语法,当程序被执行时,能够载入bash的相关环境配置文件。# Program:# This program is used for aligning of RNA-seq data.#History:# 2020/06/19 zexing First release#对变量${i}利用 for $

2020-07-07 15:59:43 4176 2

原创 RNA-seq流程学习笔记(15)-使用DESeq2进行差异基因分析

参考文章:转录组入门7-用DESeq2进行差异表达分析Analyzing RNA-seq data with DESeq21.关于DESeq2的概述A basic task in the analysis of count data from RNA-seq is the detection of differentially expressed genes. The count data are presented as a table which reports, for each sample

2020-06-23 14:15:54 36577 13

原创 RNA-seq流程学习笔记(14)-在windows10平台上利用R包合并表达矩阵、设置实验分组信息、列名及数据的导入导出

(base) zexing@DNA:~/projects/zhaoxiujuan/aligned$ wc -l *.count 24426 m3108.count 24426 m3110.count 24426 m3111.count 24426 m3112.count 24426 m3113.count 24426 m3114.count 24426 msh1.count 24426 msh2.count 24426 Scr.count 219834 total(

2020-06-16 16:07:53 4081

原创 RNA-seq流程学习笔记(13)-Bioconductor相关软件的安装(持续更新)

参考文章:因为我的服务器没有外网的原因,尝试了对R设置清华镜像源,可以下载R相关的包,但生物信息学分析会用到很多Bioconductor的软件,需要使用BiocManager软件,试了几次发现服务器中无法安装BiocManager软件,或者使用conda安装了后,在R中无法调用。清华镜像源也提供了Bioconductor的镜像源,说明如下:Bioconductor 镜像源配置文件之一是 .Rprofile (linux 下位于 ~/.Rprofile )。在文末添加如下语句:options(BioC

2020-06-11 15:22:34 2780 1

原创 RNA-seq流程学习笔记(12)-R包的相关操作及国内镜像源的设置

参考文章:4种R包安装方式R语言包相关命令setRepositoriesR install.packages() 设置国内CRAN镜像清华大学开源软件镜像站R语言-默认镜像设置R包安装及设置镜像对于生信老菜鸟来说,学习R语言还真是挺困难的,就像同事说的,R的知识看起来零零散散,怪我自己还没学好R语言入门的书籍。万事开头难啊,硬着头皮上吧。对于RNA-seq流程中,前期数据处理应该对.count文件进行处理,目前所知有三个软件可以使用:DESeq2、edgeR和ballgown。这三个软件好

2020-06-11 15:04:53 3409

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除