- 博客(2)
- 收藏
- 关注
原创 UKBiobank Olink蛋白数据预处理-python
KNN插补操作(以Male组为例):首先将所有男性按照10个地区的编码进行划分,其中一个区域作为测试集,其他作为训练集,通过调用sklearn.impute.KNNImputer,并计算与每一个蛋白pearson相关系数最大的50个蛋白,利用这50个相关蛋白与对缺失值进行插补。由于Olink蛋白数据的保存为下图格式,每一个患者都有多个蛋白数据,即同一个eid对应了多个protein_id行,因此,为了转化为一个患者id一个数据行的格式,需要对每个eid依次读取。提取患者id和蛋白id的列表。
2024-05-29 09:10:52 382
原创 【文献解读】Nature Communications 2023 - 血浆蛋白组学预测个体未来健康风险
对人类疾病的全面风险评估往往需要对潜在的风险因素进行严格的积累,并且只能针对单一的疾病进行。然而收集疾病相关信息涉及的时间及成本巨大,阻碍了最终的风险评分在临床中的应用。因此,需要一种可以同时对多种疾病风险预测的方法。许多国家建议通过常规血液检查预防一些常见疾病,因此结合蛋白组学的风险评分将会有助于多种疾病的风险预测。但目前大多蛋白组学的研究都是以横断面方式进行的,其中一些研究利用病例对照方法了解某些疾病的患病和健康人群蛋白组差异。
2024-05-08 15:44:29 665
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人