记录一些看到的开源数据,集齐5个发一次。
1
ABC@UofSC包含来自南卡罗来纳州健康被试的横向数据(N=800,年龄=20-80)和纵向数据(N=200,年龄=60-80,间隔4年)样本的各种数据,包括社会人口学数据、原始和预处理的功能MRI数据(resting-state and task based fMRI, ASL)和结构MRI数据(T1、T2 FLAIR、DWI、SWI),原始和预处理过的 resting-state EEG,全面的血液检查,身体和感官功能的测量,从血液和口腔拭子得到的遗传数据,以及社会、情感、认知和语言测量的独特组合结果。在纵向研究中,已经收集了65名被试(60-80岁)的数据。
该数据需要有USC的合作者
2
健康大脑网络(HBN)研究中公开的弥散核磁共振成像(dMRI)数据(N=2747)。整理到了BIDS,并进行预处理,提供自动质量控制(QC)分数。此外还他们还训练了一个做质量控制神经网络模型,该网络的质量控制结果与专家们对所持数据集的质量控制结果高度一致(ROC-AUC = 0.947)。
值得一提的是,处理管道是他们发表在nature method上的,值得参考:
Cieslak M, Cook PA, He X, Yeh FC, Dhollander T, Adebimpe A,Aguirre GK, Bassett DS, Betzel RF, Bourque J, Cabral LM, Davatzikos C, DetreJA, Earl E, Elliott MA, Fadnavis S, Fair DA, Foran W, Fotiadis P, GaryfallidisE, et al. QSIPrep: an integrative platform for preprocessing and reconstructingdiffusion MRI data. Nature methods. 2021 Jul; 18(7):775–778. http://dx.doi.org/10.1038/s41592-021-01185-5,doi: 10.1038/s41592-021- 881 01185-5.
3
包括对自然背景下物体图像的高时间分辨率的EEG反应。这个数据集包括10个被试,每个被试有82,160次试验,跨越16,740个图像条件。基于该样本的研究表明,EEG数据集的大量条件以及试验重复都有助于训练后的模型的预测准确性。这是一个被试内大样本设计,有助于视觉神经科学和计算机视觉的研究。
剩下两个是之前的推送,一并整理在此。
4
之前推送过该文章的preprint,并且还有他们解释为什么被试内采样更重要的观点类文章。被试间大样本并不是实现可重复性的唯一途径。
一批高质量,被试内重复采样的7T数据即将共享,是做视觉和computational modeling不错的资源。简单看下有什么:
Using ultra-high-field fMRI (7T, whole-brain, T2*-weighted gradient-echo EPI, 1.8-mm resolution, 1.6-s TR), we measured BOLD responses while each of 8 participants viewed 9,000–10,000 distinct, color natural scenes (22,500–30,000 trials) in 30–40 weekly scan sessions over the course of a year.
Access似乎也比较容易,需要提交一个谷歌form。作者在文末提到要保留一部分数据作为held-out dataset用于data chanllenge。文章进行了不少分析,代码作者也会分享,其中做去噪的方法似乎值得了解一下。
目前大部分的研究关注的都是group level,group-to-individual generalization是当前psychology/neuroimaging领域面临的挑战之一。
推荐阅读:
①Hamaker, E. L. (2012). Why researchers should think "within-person": A paradigmatic rationale. In M. R. Mehl & T. S. Conner (Eds.), Handbook of research methods for studying daily life (p. 43–61). The Guilford Press.
the large-sample approach is not necessarily the only appropriate research approach in psychology
several alternatives to the standard large-sample approach that allow us to take a closer and more detailed look at the processes as they are occurring in daily life
②Poldrack, R. A., Laumann, T. O., Koyejo, O., Gregory, B., Hover, A., Chen, M. Y., ... & Mumford, J. A. (2015). Long-term neural and physiological phenotyping of a single human. Nature communications, 6(1), 1-15.
18个月里,Russell A. Poldrack自己当被试做了很多很多次的采样。
③Fisher, A. J., Medaglia, J. D., & Jeronimus, B. F. (2018). Lack of group-to-individual generalizability is a threat to human subjects research. Proceedings of the National Academy of Sciences, 115(27), E6106-E6115.
We provide evidence that conclusions drawn from aggregated data may be worryingly imprecise. Specifically,the variance in individuals is up to four times larger than in groups.
5
该图很好地总结了有哪些地方可以找到开源的数据,一些常见的数据比如ABCD,Ping和Philly等应该是归类到了NDA之下了。