开源数据1

记录一些看到的开源数据,集齐5个发一次。

1

746b8da04daf0c454fd2f72e1961f685.png

1fc88a0fe027e6f9f3676cb2517a674e.png

ABC@UofSC包含来自南卡罗来纳州健康被试的横向数据(N=800,年龄=20-80)和纵向数据(N=200,年龄=60-80,间隔4年)样本的各种数据,包括社会人口学数据、原始和预处理的功能MRI数据(resting-state and task based fMRI, ASL)和结构MRI数据(T1、T2 FLAIR、DWI、SWI),原始和预处理过的 resting-state EEG,全面的血液检查,身体和感官功能的测量,从血液和口腔拭子得到的遗传数据,以及社会、情感、认知和语言测量的独特组合结果。在纵向研究中,已经收集了65名被试(60-80岁)的数据。

该数据需要有USC的合作者

9cd7ccb260dd08058f54b00779895d11.png

2

ccb904fa3e60f1b2b7adb3cf0b25eee1.png

健康大脑网络(HBN)研究中公开的弥散核磁共振成像(dMRI)数据(N=2747)。整理到了BIDS,并进行预处理,提供自动质量控制(QC)分数。此外还他们还训练了一个做质量控制神经网络模型,该网络的质量控制结果与专家们对所持数据集的质量控制结果高度一致(ROC-AUC = 0.947)。

值得一提的是,处理管道是他们发表在nature method上的,值得参考:

Cieslak M, Cook PA, He X, Yeh FC, Dhollander T, Adebimpe A,Aguirre GK, Bassett DS, Betzel RF, Bourque J, Cabral LM, Davatzikos C, DetreJA, Earl E, Elliott MA, Fadnavis S, Fair DA, Foran W, Fotiadis P, GaryfallidisE, et al. QSIPrep: an integrative platform for preprocessing and reconstructingdiffusion MRI data. Nature methods. 2021 Jul; 18(7):775–778. http://dx.doi.org/10.1038/s41592-021-01185-5,doi: 10.1038/s41592-021- 881 01185-5.

3

c6d45af9db5861e23f93e05a806a2811.png

d2cba318033c45686cd14b0fd8eed9b5.png

包括对自然背景下物体图像的高时间分辨率的EEG反应。这个数据集包括10个被试,每个被试有82,160次试验,跨越16,740个图像条件。基于该样本的研究表明,EEG数据集的大量条件以及试验重复都有助于训练后的模型的预测准确性。这是一个被试内大样本设计,有助于视觉神经科学和计算机视觉的研究。

剩下两个是之前的推送,一并整理在此。

4

cc9aeea10dad1d81711a4bb2add1d4bc.png

之前推送过该文章的preprint,并且还有他们解释为什么被试内采样更重要的观点类文章。被试间大样本并不是实现可重复性的唯一途径。

0089d3b7146563001c43acc3367b434d.png

一批高质量,被试内重复采样的7T数据即将共享,是做视觉和computational modeling不错的资源。简单看下有什么:

Using ultra-high-field fMRI (7T, whole-brain, T2*-weighted gradient-echo EPI, 1.8-mm resolution, 1.6-s TR), we measured BOLD responses while each of 8 participants viewed 9,000–10,000 distinct, color natural scenes (22,500–30,000 trials) in 30–40 weekly scan sessions over the course of a year.

176c15e5d07a5c95877a13837e827e5f.png

Access似乎也比较容易,需要提交一个谷歌form。作者在文末提到要保留一部分数据作为held-out dataset用于data chanllenge。文章进行了不少分析,代码作者也会分享,其中做去噪的方法似乎值得了解一下。

5339b23e7b3c7470d84de20a4c81724a.png

目前大部分的研究关注的都是group level,group-to-individual generalization是当前psychology/neuroimaging领域面临的挑战之一。

推荐阅读:

①Hamaker, E. L. (2012). Why researchers should think "within-person": A paradigmatic rationale. In M. R. Mehl & T. S. Conner (Eds.), Handbook of research methods for studying daily life (p. 43–61). The Guilford Press.

  • the large-sample approach is not necessarily the only appropriate research approach in psychology

  • several alternatives to the standard large-sample approach that allow us to take a closer and more detailed look at the processes as they are occurring in daily life

②Poldrack, R. A., Laumann, T. O., Koyejo, O., Gregory, B., Hover, A., Chen, M. Y., ... & Mumford, J. A. (2015). Long-term neural and physiological phenotyping of a single human. Nature communications6(1), 1-15.

18个月里,Russell A. Poldrack自己当被试做了很多很多次的采样。

f879cbd189cacde0687cd190ab899fd0.png

③Fisher, A. J., Medaglia, J. D., & Jeronimus, B. F. (2018). Lack of group-to-individual generalizability is a threat to human subjects research. Proceedings of the National Academy of Sciences, 115(27), E6106-E6115.

  • We provide evidence that conclusions drawn from aggregated data may be worryingly imprecise. Specifically,the variance in individuals is up to four times larger than in groups

5

ee359e4971060b1d26ec64ee1997ab05.png

58709bd4057d05381909e0e1079a4894.png

39f2d313d0a31e9406a2277d616e82ef.png

该图很好地总结了有哪些地方可以找到开源的数据,一些常见的数据比如ABCD,Ping和Philly等应该是归类到了NDA之下了。

8f98fc60bb75203fc026b6a047918c88.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值