自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 各软件使用手册及官网

高通量测序数据处理学习记录(四):DeepTools学习笔记

2022-12-06 22:00:19 289

原创 MACS2 -m/--mfold使用

macs2 callpeak -m 5 50 -q 0.05 -t Dy_7_1_clean.bam.sort -f BAM -g mm --outdir /Data/wu_lab/yuanye/projects/CUT_TAG/zwh/peak/ -n Dy_7_1_H3K9me3 -Bhttp://www.360doc.com/content/18/0205/00/19913717_727772514.shtml

2022-08-08 21:56:28 1059

原创 Rolling_average_plots

教程:bedtools的使用技巧(持续更新)bedtools使用指南bedtools统计窗口内平均覆盖深度目的:画一个类似这样的图思路:1.划分参考基因组,将参考基因组划分为大小一样的n个窗口。比如划分hg19,每个窗口大小10kb。将这些窗口作为后续计算reads数的区间。2.利用bedtools coverage 计算每个区间的reads数,并根据RRPM进行normalization。3.利用metaplot/python的时间序列分析(pandas函数)进行作图。1.划分b

2022-05-11 11:24:45 341

原创 ATAC数据做heatmap信号热图与谱图(deeptools)

简介:本次使用的是孔老师的数据,目的想用ATAC数据中combine相对于control来说down的peak来做一组信号热图与谱图。因此bed文件使用的是提取的down的peak.bed文件。参考以下教程https://www.jianshu.com/p/1f38674b2475deeptools 提供了computeMatrix命令以计算特定基因组区域的ChIP-seq信号,并通过plotHeatmap和plotProfile函数分别产生ChIP-seq信号热图与谱图。computeMatr

2022-05-11 11:22:27 4516 2

原创 生信小tips

说明:做生信过程中有很多小细节需要注意,留个备忘录方便后面查找命令对染色体命名列内容修改第一列为染色体号,如果要修改成chr格式 sed -i -e 's/^/chr/g' ().narrowPeak

2021-12-30 09:55:50 2685 6

原创 火山图 volcano

一、数据集准备主要用到的就是log2foldchange和pvalue/padj值二、画图library(ggplot2)k_DIPG17_2_1_merge_2vs1_25 <- read.csv("DIPG17_2_1_merge_2vs1_25.csv")DIPG17_2_1_merge_2vs1_25_up<-subset(k_DIPG17_2_1_merge_2vs1_25,pvalue<0.05 & log2FoldChange >1)DIPG17_

2021-12-16 17:30:42 713

原创 sratoolkit 2.11.3安装与使用

备注:下载该版本原因是因为使用2.9.2版本的fastq-dump/fasterq-dump出现了以下错误fasterq-dump --split-3 SRRid -e 72021-12-02T12:47:28 fasterq-dump.2.9.2 sys: timeout exhausted while reading file within network system module - mbedtls_ssl_read returned -76 ( NET - Reading informatio

2021-12-02 21:48:56 2280

原创 从头RNASEQ

1.QC质控 步骤与CHIPSEQ相同2.STAR进行比对2.1建立STAR索引建立索引前首先下载参考基因组文件人类参考基因组网站https://www.gencodegenes.org/human/↑下载GTF文件以及fa文件。利用wget -c可以无断点下载。鼠的基因组同上。建立索引时 STAR --runMode genomeGenerate --runThreadN 16 --genomeDir /Data/wu_lab/reference/starindex/mouse

2021-10-27 16:25:09 1162 2

原创 KEGG图

泡泡图r中作图输入文件类型library(ggplot2)setwd("F:/chip-seq/dongfeng/2021_8_11")library(readxl)f <- read_excel("KEGG-2.xls")FoldEnrichment=f$`Fold Enrichment`pathway=f$Termp = ggplot(f,aes(FoldEnrichment,pathway))p = p + geom_point(aes(size=Count))p1 =

2021-10-19 16:15:03 405

原创 rnaseq_dongfeng_overlapABC_heatmap

提要:本次实验给了我三个样品ABC,其中A是单端测序仅有一个文件,B,C为双端测序,有两个文件。给我的数据都是clean data,因此我没有进行质控,直接从STAR比对开始,然后利用了rsem进行转录本定量。利用DEseq2进行差异表达分析。其中分组为B相对与A上调的基因为upAB,B相对于C上调的基因为upBC。分别找到两组上调基因后去overlap共同的基因,然后将这些overlap到的基因做个火山图。寻找上调差异基因** 设计一个sampleAB,BC.txt的文件 **** 以及一个ge

2021-08-18 14:52:55 309

原创 从头chipseq

1.下载sra文件wget http……ncbi(data).sra2.将sra文件转为fastq文件fastq-dump --split-3 filename注:- -split-3 如果是双端测序则出现两个fastq文件,如果是单端测序则只有一个文件。得到的文件应该是fastq,下面非为两个方法去找后面的peak。一.nf-core-chipseq pipeline进行分析说明:该方法适用于有输入文件即input的chipseq分析,如果没有input文件则无法设计design.csv文

2021-08-06 09:43:11 1356

原创 2021-08-03

将sra文件转成fastq格式yuanye@DNA:~/projects/dongfeng/ChIP_seq/2021_7_29/data/fastq$ ~/software/sratoolkit.2.11.0-ubuntu64/bin/fastq-dump --split-3 SRR…….1将fastq格式压缩yuanye@DNA:~/projects/dongfeng/ChIP_seq/2021_7_29/data/fastq$ gzip -c SRR…….1_1.fastq > SRR…

2021-08-03 20:54:50 119

原创 conda环境更新——神速装软件

conda环境更新——神速装软件更新conda(base) yuanye@DNA:~/miniconda3$ cd(base) yuanye@DNA:~$ conda update -n base conda出现选项时选择yesProceed ([y]/n)? y结束时出现以下内容Preparing transaction: doneVerifying transaction: doneExecuting transaction: done当更新完毕后,查看一下conda版本

2021-06-14 17:43:27 901

原创 RNA-seq流程——使用hisat2进行序列比对(不利用循环&利用循环)(未完待续)

RNA-seq流程——使用hisat2进行序列比对(不利用循环&利用循环)(未完待续)本次使用ky老师的文件进行序列比对,比对时使用双端比对,_1.clean.fq.gz,_2.clean.fq.gz一、不利用循环进行比对1.进行比对前,首先将目录转到有.fq.gz的文件夹下hisat2 -t -p 8 -x /f/xudonglab/yuanye/reference/UCSC_mm10/hisat2_index/hisat2_index_mm10 \#最后的\一定要加,不然程序直接就运行了,包括

2021-06-14 14:58:28 3246 5

原创 RNA-seq做数据质控

本次我利用ky老师的数据进行第一次RNA-seq分析流程训练,本次的样品为DIPG4-3,4各两组RNA-seq做数据质控1.使用fastqc命令对数据进行质控首先进入存有数据的目录中,并对目录进行变量命名dir=/f/xudonglab/yuanye/projects/kongyu/RNA_seq/2021_02_22使用fastqc命令进行数据质控(base) yuanye@DNA:~/projects/kongyu/RNA_seq/2021_02_22$ fastqc -t 4 -o

2021-06-10 17:22:35 718

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除