1.基因dropouts:
基因在一个细胞中呈现中等表达水平,但在另一个细胞中未检测到表达,这可能源于scRNA-seq中的RNA总量低导致的扩建文库丢失或RNA表达的丢失性。
2.k-mer:
k-mer是来自于测序子序列中长度为k的子序列。例如,假设有短序列ATCCCGGGTTAT,想从中获得7-mer。为此,我们将提取前七个碱基作为第一个7-mer,然后向下移动一个碱基获得第二个7-mer,以此类推得到从序列中推出的所有7mer。
3.landscape:
一般会翻译成图谱。landscape往往是基于全面的测序,宏观地解读数据,所以不是景观,而是全貌,图谱则是代表一种疾病或者一种现象整体的表现。
4.细胞间差异:
也可以理解为细胞个体差异。其表达的意思是说,每个个体细胞的生理生化过程都会有差异,一般的生物学研究方法是取细胞群体作为研究对象,忽略个体差异,但这样很有可能无视了一些细胞内细小的变化。所以后来提出这样一个概念。
5.manifold learning:流形学习
6.cell differentiation: 细胞分化
7.RNA velocity:RNA速率能够通过叠加剪接信息来推断细胞分化的方向性。
特定基因的转录诱导导致(新转录的)前体未剪接mRNA的增加,而相反,转录的抑制或缺失导致未剪接mRNA的减少。因此,通过将未剪接的mRNA与成熟的剪接mRNA进行区分,可以近似地得到mRNA丰度的变化,即其时间导数,即RNA速度。跨mRNA的速度