伪时序分析词汇(三)

本文探讨了基因检测中的常见问题,包括假阴性错误(有时未能检测到高水平基因)、假阳性错误(低水平基因因扩增偏差被过度估计),以及批量效应(实验条件差异导致的数据偏移)。此外,介绍了流形假设,即复杂高维数据实际可能存在于低维结构中,以及本征维度的概念,它是描述数据内在复杂性的关键参数。理解这些概念对于提高基因检测的准确性至关重要。
摘要由CSDN通过智能技术生成
  1. 假阴性错误(false-negative errors):
    高水平的基因可能偶尔没有检测到

  2. 假阳性错误(false-positive errors):
    低水平表达的基因由于扩增偏差,可能显得过于丰富,导致假阳性错误

  3. 批量效应(batch effect):
    当实验设计不当的时,数据结果会显著受到批量效应的影响。
    批量效应是指在不同条件下测量总体产生不同的性质,且与研究中的生物或者科学变量无关。例如在周一运行一组实验,在周二运行另一组实验,或者两个技术人员负责不同的实验,或者使用两种不同批量的试剂,芯片,仪器,可能会出现批量效应。

  4. 流形假设(manifold hypothesis):
    通常假定现实世界的高维数据位于嵌入在高维空间的低维流形上,这被称为流形假设。
    假定数据是嵌入到高维空间的低维流形采样,流形学习的目的是恢复数据的低维表示结构。

  5. 本征维度(intrinsic dimensionality):
    数据的本征维度是在考虑到数据观测属性所需的最小参数个数。换句话说,本征维度是用于表示原始数据嵌入流形的最小维度。
    理想情况下,降维后的表示维度应该对应于数据的本征维度。

  6. ground truth :训练集认为100%准确的标签(人工标注的结果)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值