2020年12月发在Biological Psychiatry上的综述(2月online),筛选了2010年到2019年机器学习有关的文章进行分析。文章一口气看完毫无压力,推荐阅读。补充材料罗列综述中每篇文章的详细信息,也许有可能会有用。
首先文章提供了几个机器学习运用在认知、行为以及疾病领域的Fun Facts。
1. 发文数量逐年增加。
2. 样本越小越容易得到更高的预测准确率。
3. 大家喜欢用机器学习预测什么。
4. 机器学习在病人样本上表现出了更高的准确率。【4和5不知道有没有考虑样本量的影响,因为多模态的文章和使用patients的研究使用的样本量有可能较小,所以造成其准确率高】
5. 使用多模态预测的结果好于单一模态。
此外文章还简单科普了一下几个常用的线性回归的方法
Simple/Multiple Linear Regression
介绍了connectome-based predictive modeling (CPM),它的核心其实就是特征选择+简单线性回归。
LASSO
Ridge
Elastic Net
Linear SVM
Relevance Vector Regression
PLS regression
最后文章提出该领域的挑战和未来的方向
使用多模态数据。
使用独立的数据对模型进行验证。
使用任务而不是量表对特质进行测量。
使用深度学习。
建立Longitudinal的预测模型
其中第一点值得一提,使用多模态并不仅仅是通过使用不同模态的数据增加特征的数量进行预测,而是如何融合多模态的数据产生更为有效的特征。
end