- 博客(26)
- 收藏
- 关注
原创 6.ArchR的可视化(3):TF的序列标识图
2)greenleaf文中的对这一部分的描述如下:We used the cell-by-peaks and the Catalog of Inferred Sequence Binding Preferences (CIS-BP) motif (from chromVAR motifs ‘human_pwms_v1’) matches within these peaks from motifmatchr ”matchMotifs(positions=out)“可视化一段序列某个位点的保守性;
2024-04-24 10:05:53 597
原创 6.ArchR的可视化(2):TF activity
#markerMotifs <- markerMotifs[markerMotifs %ni% "z:SREBF1_22"] 过滤掉很像但不是EBF1的Motif。> projHeme2 <- addGroupCoverages(ArchRProj=projHeme2, groupBy="celltype") #构建拟混池重复。> markerMotifs <- grep("z:", markerMotifs, value = TRUE) #用grep函数只提取对应特征的z-scores。
2024-04-23 10:15:32 694
原创 6.ArchR的可视化(1):multiomic tracks
为了能跟模仿出greenleaf团队的形式:先看看作者在文献中的描述把:首先将片段读取到R中的GenomicRanges对象中。3) useMatrix = "TileMatrix"将鉴定对特定细胞组高度特异性的基因组区域,并useMatrix = "PeakMatrix"鉴定对特定细胞组高度特异性的峰。GRanges与IRanges相比,它可以定义序列名称,包括起始点及终止点的长度信息,正负链,或者他们的score值和GC值等;在以CD14为对象时的矩阵。100bp的平滑)每100bp可视化一次。
2024-04-21 20:03:40 738 1
原创 4.ArchR的降维-聚类(3)
2)ArchR 采用两阶段的方法进行Peak Calling:1)先用bin长度(默认为500bp)得到的TileMatrix矩阵(Bin-cell)矩阵并作聚类,2)然后把得到的每一个类中所有的Read汇总起来(PeakMatrix)做Peak Calling.这里ArchR采用了MACS2的方法。其中ArchR中Bin的长度默认为500bp得到TileMatrix矩阵,这种小的Bin能够更精确地检测到TF的结合位点或位置范围(300-500bp)最后最后,恳请走过路过的朋友们留下您们宝贵的意见。
2024-04-15 21:01:54 400
原创 4.ArchR的降维-聚类(1)
先计算一个:TF-IDF矩阵,然后输入irlba SVD,前50个SVD维度用作Seurat对象的输入,并使用Seurat的SNN图FindClusters执行初始聚类,分辨率为1.5(其中健康造血采用25个SVD)。我们发现,在某些情况下,实验之间存在批量效应,为了最小化这种影响,我们确定了初始cluster中前50000个可变的peak峰(并进行测序深度矫正的CPM转换,edgeR log(每百万计数)),使用这50000个可变峰(即PeakMatrix)对稀疏二值化矩阵进行子集,
2024-04-10 22:02:33 1697 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人