Suicidal Ideation Detection: A Review ofMachine Learning Methods and Applications（2020 自杀意念检测，综述）

本文链接：https://blog.csdn.net/weixin_39699362/article/details/131795706

自杀意念检测方法（图1）：

1.临床方法：

enek等人[9]设计了一份五项普遍存在的自杀风险评估问卷，并对患者的反应采用分层分类器来确定其自杀意图。通过面对面的交流，可以利用语言和声音信息。Scherer[23]在一次二元访谈中研究了韵律语音特征和语音质量，以识别有自杀倾向和无自杀倾向的青少年。其他临床方法通过转换后的传感信号检测静息状态心率[24]，对基于功能磁共振成像的死亡和生命相关词汇的神经表征进行分类[25]，并对从脑电图信号转换的事件相关促动因子进行分类[26]。临床治疗的另一个方面是对自杀行为背后的心理的理解[5]，然而，这在很大程度上依赖于临床医生的知识和面对面的互动。采用临床访谈的自杀风险评估量表可以为预测自杀提供信息线索[27]。Tan等[28]进行了一项研究在微博上进行访谈和调查研究，以探索直接信息干预自杀未遂者的参与。

2.社交网站内容分析

人工构建自杀相关关键字词典和词典，实现关键字过滤[29]、[30]和短语过滤[31]。与自杀相关的关键词和短语包括“杀死”、“自杀”、“感到孤独”、“抑郁”和“自残”。Vioul 'es等人[3]使用带注释的Twitter数据集构建了一个逐点互信息症状词典。Gunn和Lester[32]分析了自杀未遂者死亡前24小时内Twitter上的帖子。Coppersmith等人[33]分析了同一平台数据的语言使用情况。自杀念头可能涉及强烈的负面情绪、焦虑和绝望，或其他社会因素，如家庭和朋友。Ji等[17]对自杀相关内容进行了词云可视化和话题建模，发现自杀相关讨论涵盖了个人和社会问题。Colombo等[34]分析了Twitter社交网络中连通性和沟通的图形特征。Coppersmith等人[35]对Twitter上的语言模式和情绪进行了探索性分析。其他方法和技术包括谷歌趋势分析用于自杀风险监测[36]，通过语言线索进行回复偏差评估[37]，人机混合方法用于分析社会支持对自杀意念风险的语言影响[38]，社交媒体内容检测和语音模式分析[39]。

3.机器学习

a.结构化数据

杀意念检测的表格数据包括问卷调查结果和从网站上提取的结构化统计信息。这样的结构化数据可以直接用作分类或回归的特征。Masuda等[40]基于用户特征和社会行为变量，应用logistic回归对自杀组和对照组进行分类。研究发现，社区数量、局部聚类系数、同质性等变量对日本SNS自杀意念的影响更为显著。Chattopadhyay[41]采用Pierce suicide Intent Scale (PSIS)评估自杀因素并进行回归分析。问卷是表格特征的良好来源。Delgado-Gomez等[42]采用国际人格障碍检查筛查问卷和Holmes-Rahe社会再适应评定量表。Chattopadhyay[43]提出采用多层前馈神经网络，根据Beck的自杀意向量表对自杀意向指标进行分类。

b.非结构化数据

主要特征包括N-gram特征、基于知识的特征、句法特征、上下文特征和类特定特征[44]。about等人[45]在9个自杀主题中构建了一组用于词汇特征提取的关键词。Okhapkina等人[46]建立了一个关于自杀内容的术语词典。他们为消息引入了术语频率逆文档频率(TF-IDF)矩阵，并为矩阵引入了奇异值分解(SVD)。Mulholland和Quinn[47]提取了词汇和句法特征，建立了一个分类器来预测词作者自杀的可能性。Huang [48]等人通过扩展常识词集HowNet构建了心理词典词典，并使用支持向量机(SVM)检测中文微博中的网络自杀。话题模型[49]与其他机器学习技术相结合，用于识别新浪微博中的自杀行为。Ji等人[17]提取了统计、句法、语言查询和词计数(LIWC)、词嵌入和主题特征等多个信息性特征集，然后将提取的特征放入分类器中，如图2b所示，其中比较了四种传统的监督分类器。Shing等[13]提取了词包(bow)、移情、可读性、句法特征、话题模型后验、词嵌入、语言查询和词计数、情感特征和精神疾病词汇等特征。

自杀意念检测模型包括SVM[44]、人工神经网络(ANN)[50]和条件随机场(CRF)[51]。Tai等[50]选取了候选人的自杀意念和自残行为史、宗教信仰、家庭状况、精神障碍史及其家庭等特征。Pestian等人[52]比较了不同多变量技术在字数、词性、概念和可读性得分方面的表现。同样，Ji等[17]比较了逻辑回归、随机森林、梯度增强决策树和XGBoost四种分类方法。Braithwaite等[53]验证了机器学习算法可以有效识别高自杀风险。

c.情感特征

感特征是企图自杀的人和健康人之间最明显的差异之一，这引起了计算机科学家和心理健康研究人员的相当大的关注。为了检测自杀遗书中的情绪，Liakata等[51]采用手工情绪分类，包括愤怒、悲伤、希望、快乐、平和、恐惧、骄傲、虐待和宽恕。Wang等[44]采用事实方面(2类)和情感方面(13类)的组合特征来发现细粒度的情感分析。同样，Pestian等人[52]发现了虐待、愤怒、责备、恐惧、内疚、绝望、悲伤、宽恕、快乐、平静、希望、爱、骄傲、感激、指示和信息等情绪。Ren等人[14]提出了一种复杂情绪主题模型，并将其应用于分析自杀博客中积累的情绪特征，并从博客流中检测自杀意图。具体而言，作者研究了喜悦、爱、期待、惊喜、焦虑、悲伤、愤怒和憎恨八种基本情绪的情绪积累、情绪协方差和情绪过渡等情绪积累特征。

4.深度学习

该方法无需复杂的特征工程技术，即可有效地自动学习文本特征。同时，也有人将提取的特征纳入深度神经网络;例如，Nobles等人[54]将心理语言特征和单词出现情况输入多层感知机(MLP)。自然语言文本通常使用流行的词嵌入技术(如word2vec[55]和GloVe[56])嵌入到分布式向量空间中。Shing等[13]采用过滤器大小为3、4、5的用户级CNN对用户的帖子进行编码。长短期记忆(LSTM)网络是一种流行的RNN变体，它用于对文本序列进行编码，然后用全连接层进行分类处理[17]。

最近的方法引入了其他先进的学习范式与深度神经网络相结合，用于自杀意念检测。Ji等人[57]提出了模型聚合方法，用于更新神经网络，即cnn和lstm，以检测私人聊天室中的自杀意念。然而，分散式训练依赖于聊天室中的协调员来标记用户帖子以进行监督训练，这只能应用于最小的场景。一种可能更好的方法是使用无监督或半监督学习方法。Benton等[16]利用多任务学习框架下的神经模型，通过预测用户性别作为辅助任务来预测自杀企图和心理健康。Gaur等人[58]将外部知识库和自杀相关本体纳入文本表示，并使用CNN模型获得了改进的性能。Coppersmith等人[59]开发了一种

深度学习模型采用GloVe进行词嵌入，双向LSTM进行序列编码，自注意机制捕获信息量最大的子序列。Sawhney等[60]使用LSTM、CNN和RNN进行自杀意念检测。同样，Tadesse等[61]采用LSTM-CNN模型。Ji等[62]提出了一种结合LSTM和主题建模的关注关系网络，用于对文本和风险指标进行编码。在2019 CLPsych共享任务[63]中，应用了许多流行的深度神经网络架构。Hevia等人[64]使用不同的模型评估预训练的效果，包括基于gru的RNN。Morales等人[65]研究了几种流行的深度学习模型，如CNN、LSTM和神经网络合成(NeuNetS)。Matero等人[66]提出了使用分层关注RNN和BERT的双上下文模型。另一个子方向是所谓的混合方法，它将小特征工程与表示学习技术相结合。Chen等[67]提出了一种行为模型和自杀语言模型的混合分类模型。Zhao等[68]提出了以词嵌入和外部表格特征作为输入的D-CNN模型，用于对抑郁症自杀企图者进行分类。

自杀意念检测的应用：

1.问卷调查

精神障碍量表标准，如DSM-IV6和ICD- 107，以及IPDE-SQ提供了评估个人精神状态及其自杀可能性的良好工具。这些标准和检查指标可用于设计自我测量问卷或面对面的临床-患者访谈。为了研究自杀行为的评估，DelgadoGomez等[10]应用并比较了IPDE-SQ以及“巴拉特冲动量表”(版本11,BIS- 11)来识别可能企图自杀的人。作者还对这两个量表中的个别项目进行了研究。BIS-11量表有30个项目，4分评分，而DSM-IV中的IPDE-SQ有77个真假筛选问题。DelgadoGomez等[42]将“Holmes-Rahe Social Readjustment Rating Scale”(SRRS)和IPDE-SQ引入自杀未遂者和非自杀未遂者两组比较。SRRS由43个不同严重程度的生活事件组成。Harris等人[73]通过调查了解自杀个体的网络行为以协助自杀预防。Sueki[74]在互联网用户中进行了一项在线小组调查，研究与自杀有关的Twitter使用与自杀行为之间的关系。基于问卷调查结果，他们应用了几种监督学习方法，包括线性回归、逐步线性回归、决策树、Lars-en和支持向量机，对自杀行为进行分类。

2.电子健康病例

电子健康记录(EHRs)数量的增加为预测自杀企图者的机器学习技术铺平了道路。患者记录包括人口统计信息和与诊断相关的历史，如入院和急诊。然而，由于数据的稀疏性、临床序列的可变长度和患者记录的异质性等特点，在对医疗数据进行建模以预测自杀企图方面仍然存在许多挑战。此外，由于医疗政策的变化和诊断代码的更新，记录程序可能会发生变化。

有几项基于电子病历的自杀风险预测工作[75]，[76]。Tran等人[69]提出了一个集成的自杀风险预测框架，包括特征提取方案、风险分类器和风险校准过程。明确地，每个病人的临床病史表示为一个时间图像。Iliou等人[77]提出了一种数据预处理方法，以提高机器学习技术在精神障碍患者自杀倾向预测中的应用。Nguyen等[78]对医院精神健康患者的实际管理数据进行了短期和中期自杀风险评估。通过引入随机森林、梯度增强机和深度神经网络，作者成功地处理了数据的高维和冗余问题。虽然之前的方法取得了初步的成功，但Iliou等[77]和Nguyen等[78]的数据来源存在局限性，主要集中在精神障碍患者的历史记录中。Bhat和Goldman-Mellor[79]使用匿名的通用电子病历数据集放宽了对患者诊断相关病史的限制，并应用神经网络作为分类模型预测自杀企图。

3.遗书

遗书是人们在自杀前留下的遗书。它们通常写在信件和在线博客上，并以音频或视频的形式记录下来。遗书为NLP研究提供了材料。先前的方法使用内容分析[52]、情绪分析[80]、[44]和情绪检测[51]来检查遗书。Pestian等人[52]对两组有人格障碍或潜在病态想法的人的完成者和引出者使用转录的自杀笔记。White和Mazlack[81]使用模糊认知图分析了自杀遗书中的词频来辨别因果关系。Liakata等人[51]使用机器学习分类器对600条不同长度、不同可读性质量和多类注释的自杀信息进行分类。

文本中的情感为自杀意念的理解提供了情感线索。Desmet等[82]对2011 i2b2任务的自杀遗书进行了细粒度情绪检测。Wicentowski和Sydes[83]采用了最大熵集合分类。Wang等[44]，Kova等[84]提出了混合机器学习和基于规则的自杀遗书i2b2情感分类方法。在网络空间时代，更多的遗书以网络博客的形式写成，这些遗书可以被识别为带有潜在的自杀风险。Huang等[29]通过监测MySpace.com上的在线博客来识别有风险的博主。Schoene和Dethlefs[85]提取语言和情感特征来识别真实的自杀遗书和比较语料库。

4.在线用户内容

移动互联网和社交网络服务的广泛使用，方便了人们自由地表达自己的生活事件和感受。随着社交网站为在线讨论提供匿名空间，越来越多的精神障碍患者转向寻求帮助。有一种令人担忧的趋势是，潜在的自杀受害者会在Facebook、Twitter、Reddit和MySpace等社交网站上发布他们的自杀想法。社交媒体平台正在成为监控自杀想法和防止自杀企图的一个很有前途的渠道[86]。大量用户生成的数据为研究在线用户的语言模式提供了良好的来源。在社交网络上使用数据挖掘技术和应用机器学习技术，为理解在线帖子中的意图提供了途径，提供了早期预警，甚至减轻了一个人的自杀意图。

Twitter为研究自杀提供了一个很好的来源。O 'Dea等[12]使用公共API收集推文，并在TF-IDF特征上应用逻辑回归和支持向量机，开发了自动自杀检测。Wang等[87]通过有效的特征工程进一步提高了性能。Shepherd等人[88]对Twitter社交网络中暗示自杀倾向的内容进行了基于心理学的数据分析。作者使用了一个名为#心理健康专业人士#的在线对话的数据。

另一个著名的平台Reddit是一个针对特定话题进行讨论的在线论坛，在研究心理健康问题[89]和自杀意念[37]方面也引起了很多研究兴趣。Reddit上一个名为SuicideWatch的社区被广泛用于研究自杀意图[90]，[17]。De Choudhury等人[90]采用统计方法发现从心理健康问题到自杀的转变。Kumar等[91]调查了名人自杀后的发帖活动，研究了名人自杀对自杀相关内容的影响，并提出了一种预防名人自杀的方法。

许多研究[48]、[49]对中国微博中的自杀意念进行了检测。关等[92]等研究了微博用户概况和语言特征，用于估算中文微博的自杀概率。还有一些工作是利用其他平台来检测自杀意念。如Cash等[93]对MySpace上的青少年评论和内容分析进行了研究。蒸汽数据为用户模式分析提供了很好的数据来源。Vioul’es等[3]通过以用户为中心和以后为中心的行为分析，运用鞅框架检测Twitter数据流中的突发情绪变化，监测自杀预警信号。Ren等[14]利用从自杀者的公开博客文章中收集的博客流来研究其积累的情绪信息。

任务：

1.自杀文本分类

第一个任务——自杀文本分类可以看作是一般文本分类的一个特定领域的应用，一般文本分类包括二元分类和多类分类。二元自杀倾向分类简单地判断文本是否有自杀意念，而多类自杀倾向分类则进行细粒度的自杀风险评估。例如，一些研究将自杀风险分为五个级别:无、低、中等和严重。或者，它也可以根据心理和行为程序考虑四种类型的类别标签，即非自杀、自杀想法/愿望、自杀意图和自杀行为/计划。

另一个子任务是通过学习多方面的自杀帖子进行风险评估。Gilat等[94]采用对自杀信息特征的定义，手动给自杀帖子贴上多方面的标签，包括精神痛苦、认知归因和自杀风险水平。精神痛苦包括失去控制、急性孤独、空虚、自恋创伤、不可逆转的能量损失和情绪泛滥，并按比例放大[0,7]。认知归因是指与人际关系相关的需求受挫，或者没有归因的迹象。

2.推理自杀信息

大规模数据挖掘和机器学习算法通过使用深度神经网络取得了显著的成果。然而，简单的特征集和分类模型不足以预测复杂的自杀意图。机器学习技术需要对自杀信息进行推理，从而从文本帖子中更深入地了解自杀因素和最内在的存在。本任务旨在采用可解释的方法来研究自杀因素，并将其与常识性推理相结合，从而提高对自杀因素的预测。具体任务包括自动总结自杀因素，从心理痛苦和与自杀相关的认知归因方面寻找自杀风险的解释。

3.自杀未遂者侦查

上面提到的两个任务集中在单个文本本身。然而，自杀意念检测的主要目的是识别自杀未遂者。因此，实现用户级检测至关重要。用户级检测包括两个部分，即用户级多实例自杀检测和图上的自杀企图检测。前者将来自个人的一袋帖子作为输入，并对一袋消息进行多实例学习。后者通过社交网络中用户之间的互动建立的特定社交图来识别自杀未遂者。它考虑了社会用户之间的关系，可以看作是图中的一个节点分类问题。

4.自杀干预

自杀意念检测的最终目的是干预和预防自杀。许多有自杀意图的人倾向于在午夜发布他们的痛苦。另一项任务是为潜在的自杀受害者提供咨询，提供周到的回应，使他们能够立即得到社会关怀，减轻他们的自杀意图。Gilat等[94]介绍了八种应对策略;它们是情感支持，提供群体支持，授权，解释，认知改变诱导，说服，建议和参考。这项任务需要机器学习技术，特别是序列到序列的学习，有能力采取有效的应对策略，产生更好的反应，消除人们的自杀倾向。当社会工作者或志愿者回到网上时，这种反应生成技术也可以为他们提供一些提示，让他们写出深思熟虑的回应。

5.精神障碍和自残风险

自杀意念与心理健康问题和自残风险密切相关。因此，检测严重的精神障碍或自残风险也是一项重要的任务。如抑郁检测[95]、自残检测[96]、压力期和压力源事件检测[97]、抑郁知识图谱构建[98]、抑郁与焦虑相关分析[99]等。该领域对应的子任务类似于第四- a1节中的自杀文本分类

局限：

a)数据不足:

当前研究中最关键的问题是数据不足。目前的方法主要采用监督学习技术，需要人工标注。然而，没有足够的注释数据来支持进一步的研究。例如，带有细粒度自杀风险的标记数据只有有限的实例，没有多方面数据和带有社会关系的数据。

b)注释偏差:

几乎没有证据证实自杀行为是为了获得事实依据。因此，通过使用一些预定义的注释规则手动标记获得当前数据。基于众包的标注可能会导致标签的偏差。Shing等[13]要求专家进行标注，但只获得了有限数量的标注实例。至于人口统计数据，自杀数据的质量令人担忧，死亡率估计是一般死亡，而不是自杀。有些案件被错误地归类为意外事故或意图不明的死亡。

c)数据不平衡:

在大量的社交帖子中，有自杀倾向的帖子只占很小的比例。然而，大多数作品以近似均匀的方式构建数据集，以收集相对平衡的正、负样本，而不是将其视为不平衡的数据分布。

d)缺乏对自杀意图的理解:

目前的统计学习方法未能很好地理解自杀意图。自杀企图背后的心理学是复杂的。然而，主流的方法侧重于选择特征或使用复杂的神经结构来提高预测性能。从社交内容中自杀帖子的现象学，机器学习方法学习到统计线索。然而，他们未能结合自杀心理来推断风险因素。

未来工作：

1)新兴学习技术:

深度学习技术的进步促进了自杀意念检测的研究。更多新兴的学习技巧，本表示学习。其他学习范例，如迁移学习、对抗训练和强化学习，也可以被利用。例如，心理健康检测领域的知识可用于自杀意念检测，生成对抗网络可用于生成对抗样本以进行数据增强。在社交网络服务中，具有自杀意念的帖子处于不同帖子类别分布的长尾。为了在不平衡分布的真实场景中实现有效的检测，可以利用few-shot学习在大型社会语料库中对少数带有自杀意念的标记帖子进行训练。

2)自杀意图的理解和解释:

许多因素与自杀相关，如心理健康、经济衰退、枪支流行、日光模式、离婚法、媒体对自杀的报道和酒精使用。更好地了解自杀意图可以为有效的检测和干预提供指导。一个新的研究方向是为深度学习模型配备常识性推理，例如，通过整合外部自杀相关知识库。深度学习技术可以学习出准确的预测模型。然而，这将是一个黑盒模型。为了更好地了解人们的自杀意图并有一个可靠的预测，应该开发新的可解释的模型。

3)时间自杀意念检测:

另一个方向是在数据流上检测自杀意念，并考虑时间信息。自杀企图有几个阶段，包括压力、抑郁、自杀念头和自杀计划。建立人的帖子时间轨迹模型可以有效地监测心理状态的变化，对发现自杀意念的早期迹象至关重要。

4)主动对话干预:

自杀意念检测的最终目的是干预和预防。很少开展工作以实现主动干预。主动自杀预防在线(Proactive Suicide Prevention Online, PSPO)[105]将自杀识别与危机管理相结合，提供了一个新的视角。一个有效的方法是通过对话。自动反应生成成为一种很有前途的技术解决方案，可以及时干预自杀念头。自然语言生成技术可以用来产生咨询反应，以安慰人们的抑郁或自杀意念。强化学习也可以应用于对话式自杀干预。在自杀未遂者发布自杀信息后(作为初始状态)，网络志愿者和非专业人士将采取行动对原始帖子进行评论，并说服自杀未遂者放弃自杀念头。尝试者可以什么都不做，回复评论，或者让他们的自杀倾向得到缓解。分数将通过观察自杀企图者的反应来定义，作为奖励。对话式自杀干预使用策略梯度让代理人产生最大回报的反应，以最好地缓解人们的自杀想法。