代谢物(三)

代谢组学可以检测的样品类型

代谢组学主要研究对象是各种代谢小分子产物(MW<1000)及脂质。其样品主要是尿液,血浆或血清,脑脊液,唾液,以及细胞,组织,粪便及肠道内容物。当然,植物,真菌,微生物,土壤,以及比较特殊的样本如淋巴液,羊水,卵泡液,膝盖滑液,眼泪,精液等,都可以作为代谢组学的检测对象。

代谢组学的检测能力

非靶向代谢组学,主要包括针对小分子代谢组学和脂质组学。

小分子代谢组学

我们建立了约2700多种代谢物的LC-MS/MS本地标准品数据库。通过LC-MS/MS技术分析平台检测到的代谢物都必须与标准品库中的代谢物进行一级和二级的匹配。这些标准品库数据包括氨基酸及其衍生物、核苷酸及其衍生物、糖代谢途径中的各种代谢物、生物碱、黄酮类、萜类、酚胺类、激素及其衍生物、脂肪酸类等。

不同物种、不同组织检测到的代谢物不一样,一般针对细胞样本,通过正负离子检测,大概能定性到300个左右的物质。很多客户会问为什么不用HMDB,METLIN等公共库查库,这是因为检索公共库只能通过一级谱库来定性,在检索的过程中缺少二级支持(部分物质有二级信息,但由于仪器和设置方法等不一样,匹配结果可靠性较差),这样会产生大量假阳性鉴定结果,后期分析非常繁琐。成熟代谢组学分析实验室基本上都在自己建立数据库。

脂质组学

我们利用的是Thermo Scientific™ 公司研发的LipidSearch™ 软件(Thermo Scientific™)进行脂质鉴定与数据预处理。LipidSearch™ 软件能够实现原始数据处理、峰提取、脂质鉴定、峰对齐、和定量等的一体化分析。LipidSearch™中收录了8大类,300种亚类,约170 万种脂质分子的MS2 & MS3数据库,并基于Orbitrap™质谱仪生成的高分辨率高质量精度数据,通过子离子、母离子和中性丢失扫描的鉴别算法,实现系统地、可靠地脂质定性分析。一般细胞的脂质组项目,我们大概能鉴定到1000个左右的脂质。

代谢组学实验设计

如果是转录组学或蛋白组学,一般一组样本有3-4次生物学重复就足够了,如果一组有多个样本,可以进行随机混合并形成3个生物学重复,但是代谢组学却不是这样。

由于个体的代谢谱差异较大,我们不建议混样,一般建议植物,微生物设计6-8个平行样品,模式动物设计10个左右平行样品,临床标本设计20-30例平行样品(所有样品当然越多越好)。注意,样品不能pooling,不能反复冻融,血清/血浆不能溶血。另外,如果是用血浆,请用肝素钠抗凝。

基峰图(BPC)和总离子流图(TIC)有什么区别

基峰图(Base Peak Chromatogram,BPC):是将每个时间点质谱图中最强的离子的强度连续描绘得到的图谱。

总离子流图(TIC):在选定的质量范围内,所有离子强度的总和对时间或扫描次数所作的图。

TIC和BPC都是对于样品整体信息的反映,一般情况下BPC图比TIC图要漂亮,所以文章里面很多时候会用到BPC图。但是有的学者认为BPC图不是样品真实的反映,所以不接受BPC,只接受TIC。

代谢组学数据分析

数据分析的内容包括:
step1:XCMS数据预处理
step2:数据多位统计学分析:PCA分析;PLS-DA分析;OPLS-DA分析;permutation test分析等
step3:差异化合物筛选
step4:差异化合物鉴定
step5:差异化合物聚类分析和关联分析
step6:代谢通路分析和富集分析
step7:多组学数据关联分析(具备多组学数据)

PLS-DA和OPLS-DA模型有什么区别

OPLS-DA比PLS-DA多了一个正交换算,把与模型分类不相干的信号过滤掉,因此OPLS-DA解释能力更强。比如组间差异比较小,组内差异比较大时,用PLS-DA的VIP筛选出的可能是组内差异变量,容易误导,而OPLS-DA则优于PLS-DA,可更准确地筛选出组间差异。

为何代谢组学结果不像蛋白质组学结果提供所有鉴定的化合物

  • 一般文献不体现鉴定到总的代谢物,而是描述实验总共检测到多少离子峰,进行差异分析后鉴定到多少个代谢物。 因代谢物存在多种同分异构现象较多,且存在加和形式的多样性,如果定性结果没有经过核验,会存在很多冗余甚至假阳性的结果,所以一般不建议直接使用。
  • 代谢组学一般先定量后定性,即先通过多维统计和单变量统计学方法寻找有差异的离子,后经过查库比对,人工校验得到准确的代谢物名称及结构,这样是常用的思路和分析方法。所以不提供所有鉴定的化合物。

差异代谢物的筛选标准

  • 一般同时采用多元变量统计模型的VIP值和单变量统计T检测的P值来筛选差异代谢物。
  • 单变量统计分析方法如t检验、方差分析等更加注重代谢物水平的独立变化
  • 多元变量统计分析更加注重代谢物之间的关系以及它们在生物过程中的促进/拮抗关系。同时考量两类统计分析方法的结果,有助于我们从不同角度观察数据,得出结论,也可以帮助我们避免只使用一类统计分析方法带来的假阳性错误或模型过拟合。
  • 筛选的阈值一般是VIP>1和P<0.05。如果得到的差异代谢物很多,可以再加上差异倍数这个筛选条件。

筛选不到差异代谢物怎么办

  • 如果利用常用的筛选标准(VIP>1和P<0.05)没有找到差异代谢物,首先可以筛选阈值设得宽放些,如VIP>1和P<0. 1。
  • 如果还是没有筛选出差异代谢物,那么还可以对检测到的物质进行单维统计学分析,如FC>1.5和P<0.05,通过每单个代谢物组间样本的表达值比较分析差异代谢物,并用火山图展现。

找到差异代谢物之后,如何验证这个代谢物的功能

  • 首先要进行定性定量验证。主要是采用三重四级杆进行靶向验证,获得绝对定量信息。
  • 然后通过前期的代谢通路分析,我们知道这个差异代谢物属于哪条调控通路,那么可以对该通路上的分子进行功能验证。
  • 另外,还可以增加其他组学的数据,如转录组、蛋白组,进行相互补充。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
背景:针灸作为传统中医(TCM)的一部分在中国已有数千年的历史,并且在西方国家已逐渐被人们接受为替代疗法或补充疗法。 但是,针灸的潜在机理,尤其是不同穴位之间是否存在差异,仍然是未知之数,这阻碍了针灸的广泛应用。 结果:在这项研究中,我们开发了一种新颖的基于线性规划的特征选择方法(LPFS),以通过揭示用于针灸治疗的代谢标志在分子水平上了解针灸作用的机理。 具体而言,我们生成并研究了人体中多个穴位上针灸治疗的高通量代谢谱。 为了选择最能表征每个经络点针灸作用的代谢子集,提出了一种优化模型,以从病例和对照样品的高维代谢数据中识别生标志。 重要的是,我们使用最接近的质心作为原型,以同时最小化所选特征的数量和分类器的留一法交叉验证误差。 我们将LPFS的性能与几种最新方法进行了比较,例如SVM递归特征消除(SVM-RFE)和稀疏多项式逻辑回归方法(SMLR)。 我们发现,我们的LPFS方法趋向于揭示少量的代谢,这些代谢具有小的标准偏差和较大的偏移,这恰好满足了我们对良好生标志的要求。 从生学上讲,揭示了几种用于针灸治疗的代谢标志,它们可作为进一步机制研究的候选。 还比较了来自五个经络点的生制造者,即祖三里(ST36),良门(ST21),朱利奥(ST3),杨凌泉(GB34)和渭中(BL40),它们的相似性和差异性,为穴位的特异性提供了证据。 。 结论:我们的结果表明,代谢谱分析可能是研究针灸分子机制的一种有前途的方法。 与其他现有方法相比,LPFS在选择少量关键分子方面表现出更好的性能。 此外,LPFS是一种通用方法,可以应用于其他高维数据分析,例如癌症基因组学。
要在R中利用pheatmap包制作差异基因差异代谢Pearson相关性热图并加上显著性符号,可以按照以下步骤进行: 1. 载入pheatmap包: ```R library(pheatmap) ``` 2. 准备数据。假设有一个名为data的数据框,其中包含了差异基因与差异代谢在不同样本中的表达数据。 3. 计算Pearson相关系数。使用cor函数计算基因和代谢之间的Pearson相关系数。按行计算,结果存储在一个名为cor_mat的矩阵中。 ```R cor_mat <- cor(data, method = "pearson", use = "pairwise.complete.obs") ``` 4. 创建热图。使用pheatmap函数创建热图,并使用cor_mat作为输入。可以设置许多不同的参数来自定义热图的外观,例如col和row表示列和行的聚类方法,scale表示是否对数据进行缩放等。 ```R pheatmap(cor_mat, col = viridis::viridis(20), cluster_cols = FALSE, scale = "none") ``` 现在可以看到一个基于Pearson相关系数的热图。 5. 添加显著性符号。可以使用pch参数来添加显著性符号。pch表示点的标记符号,可以设置为任何数值或字符。在这里,我们将0(圆)分配给不显著值,1(+号)分配给P值小于0.05的值,2(*号)分配给P值小于0.01的值,3(三角形)分配给P值小于0.001的值。 首先,我们需要对每个相关系数计算P值。使用cor.test函数计算每个相关系数的P值,并将其存储在一个名为p_vals的矩阵中。 ```R p_vals <- matrix(NA, nrow = nrow(cor_mat), ncol = ncol(cor_mat)) for (i in 1:nrow(cor_mat)) { for (j in 1:ncol(cor_mat)) { p_vals[i,j] <- cor.test(data[i,], data[j,])$p.value } } ``` 现在,我们可以为每个相关系数添加符号: ```R pheatmap(cor_mat, col = viridis::viridis(20), cluster_cols = FALSE, scale = "none", pch = ifelse(p_vals < 0.001, 3, ifelse(p_vals < 0.01, 2, ifelse(p_vals < 0.05, 1, 0)))) ``` 现在,热图中的每个相关系数都用符号表示了其显著性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值