美国立卫生研究院投巨资奖励大数据挖掘

为了驯服生物实验室辛苦得出的数据洪流,美国国立卫生研究院(nih)近日宣布,今年投资3200万美元设立一个奖项,以推动研究人员开发分析和使用生物学大数据库的方法。


该奖项出自nih去年启动的大数据知识(bd2k)创新计划。nih认为应当投入更多资源帮助使用不断增长的数据集——生物医学研究者积累的基因、蛋白质和患者档案等数据。例如,在一个“干生物学”项目中,研究人员将细胞基因表达的公共数据和患者档案混合在一起,预测现存药物的新用途。


bd2k奖项“将帮助我们克服最大化利用数据洪流面临的障碍,而且目前数据积累速度正在加速。”nih院长franciscollins在新闻发布会上说。他表示,这些奖金将资助开发计算工具、软件、标准和方法,用于分享和使用大数据集。


在未来4年里,11个卓越创新中心每年将收到200万~300万美元,开发从建模癌症细胞信号到整合移动传感器数据等各个方面所需的方法和工具。另一个奖项将资助名为enigma的全球脑数据收集工作,从而发掘精神疾病的遗传根源。


最近加入enigma项目的佛蒙特大学认知神经学家hughgaravan表示,长期以来,神经影像研究也在与数据不足作斗争。他提到,约“95%的影像学研究可能每组有20个参与者”,主要原因是脑扫描成本——每人约为500~600美元。garavan研究小组则计划使用数据池探索成瘾性的基因和神经生物学基础。


另一方面,尽管大数据集增加了获得假阳性结果和错过稀有变体的概率,但总体而言,数据池策略“非常有意义”,西雅图儿童医院精神病学家jackmcclellan说。


bd2k项目还将资助加州大学圣迭戈分校建立一个“数据探索”协调中心,该中心将与其他8个机构联合开发,从而帮助研究人员更容易地发现和使用数据集。

 

 

15173009_omcV.jpg



转载于:https://my.oschina.net/u/1160813/blog/331936

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据1994年的美国人口普查数据进行数据挖掘分析,我们将使用Weka来探索那些收入超过50,000美元的人群。 Weka是一种流行的数据挖掘和机器学习工具,可以用于处理和分析大规模的数据集。使用Weka,我们可以探索人口普查数据中的各种特征和模式,以找到那些收入超过50,000美元的人群的共同特征。 首先,我们可以载入人口普查数据集到Weka中。数据集可能包含有关个人的各种属性,如年龄、教育水平、职业、工资等。我们需要使用Weka提供的数据预处理功能对数据进行清洗和准备,确保数据的质量和完整性。 接下来,我们可以使用Weka的分类算法来预测个人的收入水平。通过训练模型并使用历史数据,我们可以推断出哪些特征与超过50,000美元的收入相关联。常见的分类算法包括决策树、逻辑回归和支持向量机等。 在得出预测结果后,我们可以使用Weka提供的可视化工具来展示收入超过50,000美元的人群的特征和模式。这有助于我们更好地理解数据,并为进一步的分析提供线索。 除此之外,我们可以使用Weka进行特征选择和降维,以便建更简约的模型和更好的解释能力。Weka提供了多种特征选择和降维技术,如主成分分析和相关系数评估等。 总的来说,使用Weka对1994年美国人口普查数据进行数据挖掘可以帮助我们找到收入超过50,000美元的人群的共同特征和模式。通过分析数据,我们可以获得有关该人群的洞察,并为进一步的研究和决策提供支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值