周报第十九周
学习时间
入门第十九周:2023.9.11-2023.9.17
本周进度
1.阅读了一篇关于scHi-C 数据embedding和imputing算法的论文《Multiscale and integrative single-cell Hi-C
analysis with Higashi》。
2.借助此论文学习了单细胞基因组学中的生物相关知识。
本周问题
1.关于数据集
在higashi中用到了三种数据集分别是a)cytoBand_hg19.b)hg19_chrom.sizes.c)作者自己整理的数据集属性分别为cell_id,chrom1,chrom2,pos1,pos2,count,normalized_count.其中cytoBand_h19以及c)中的normalized_count不太清楚.作者自己整理的数据集以及cytoband_hg19部分数据如下(数据集无label)。
1)作者自己整理的数据集
2)cytoband_hg19
2.UMAP图以及其他的embedding生成的图 1) 对于其横纵坐标的意义不太清楚,在此论文中UMAP图的横纵坐标分别为UMAP1和UMAP2.
2)对于图中的PC1 value以及P value不太明白.
3)对于热点图不知道其代表的含义,比如下面的图
3. higashi将数据embedding和imputing之后将输出交给downstream-analysis.我理解的embedding是将数据从高维降为低维的过程,imputing是将稀疏的数据集中的缺失值填充的过程,不知道此理解是否正确。
下周计划
1.增强关于Higashi论文的理解,争取处理环境相关问题,并以点到面了解单细胞基因组学的相关知识。
2.学习scHi-C论文以及fast Higashi。