自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 UKBiobank Olink蛋白数据预处理-python

KNN插补操作(以Male组为例):首先将所有男性按照10个地区的编码进行划分,其中一个区域作为测试集,其他作为训练集,通过调用sklearn.impute.KNNImputer,并计算与每一个蛋白pearson相关系数最大的50个蛋白,利用这50个相关蛋白与对缺失值进行插补。由于Olink蛋白数据的保存为下图格式,每一个患者都有多个蛋白数据,即同一个eid对应了多个protein_id行,因此,为了转化为一个患者id一个数据行的格式,需要对每个eid依次读取。提取患者id和蛋白id的列表。

2024-05-29 09:10:52 382

原创 【文献解读】Nature Communications 2023 - 血浆蛋白组学预测个体未来健康风险

对人类疾病的全面风险评估往往需要对潜在的风险因素进行严格的积累,并且只能针对单一的疾病进行。然而收集疾病相关信息涉及的时间及成本巨大,阻碍了最终的风险评分在临床中的应用。因此,需要一种可以同时对多种疾病风险预测的方法。许多国家建议通过常规血液检查预防一些常见疾病,因此结合蛋白组学的风险评分将会有助于多种疾病的风险预测。但目前大多蛋白组学的研究都是以横断面方式进行的,其中一些研究利用病例对照方法了解某些疾病的患病和健康人群蛋白组差异。

2024-05-08 15:44:29 665

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除