文章:深度学习技术驱动青少年心理健康服务(Utilizing Deep Learning Technology to Propel Adolescent Mental Health Services)

目录

摘要

关键词

引言

一 问题现状和相关研究基础

1 青少年心理服务现状

2 相关研究与基础

2.1 维护儿童心理健康提上重要日程

2.2 人工智能技术与心理服务的结合

二 研究价值及解决思路

1 可行性分析

1.1 落地场景分析

1.2 技术架构设计

2 关键技术应用

2.1 情感识别

2.2 认知事理图谱构建

2.3 自动对话的生成

三 实现及部署

1 功能实现

1.1 数据处理

1.2 模型训练

1.2.1 指令微调

1.2.2 强化学习

2 部署及应用

2.1 数据安全

2.2 性能优化

四 应用效果及未来展望

1 应用效果

2 未来展望

五 问题 


摘要

目的:为解决当前青少年心理健康服务供需失衡和质量良莠不齐等问题,研究应用深度学习技术,实现青少年心理问题早期的智能咨询、筛查、评估及初步干预。

方法:通过对心理学理论及案例进行解析,构建基于因果关系的认知事理图谱和策略驱动的心理咨询对话大模型,实现自动生成回复、评估和简单干预等。

结果:经过对随机抽取的100例数据进行测试,表明该模型能够更好地理解和处理心理咨询问题,完成部分筛查、咨询和科普工作。

结论:本研究验证了深度学习技术在青少年心理健康领域的应用价值,特别是构建的大模型在当前青少年心理服务支持资源不足的情况下,提供了一种可推广、可复制的线上心理服务新模式。


关键词

心理语言模型psychological language model 生成式人工智能generative artificial intelligence 青少年心理健康服务adolescent mental health services


引言

2023 年世界精神卫生日的宣传主题为“促进儿童心理健康,共同守护美好未来”。青少年的精神健康问题主要包括焦虑、抑郁、注意力缺陷多动障碍等,其中抑郁问题尤其严重。受制于心理健康服务资源的匮乏专业知识的不足及配合程度等问题,传统服务模式下容易出现心理问题被忽视、漏诊及误诊等情况[1]。大语言模型作为人工智能领域创新性的突破,有着较高的自然语言理解和对话能力,善于处理复杂语言结构、语义及上下文信息,这些优势恰好能够用于部署心理健康的自动化问答、评估和干预。因此,上海市长宁区精神卫生中心针对传统青少年心理健康服务的痛点,提出研发一个针对青少年心理健康的智能对话模型( 以下简称“该项目”),并将其应用于早期问题识别、评估及引导的智能服务模式。


一 问题现状和相关研究基础

1 青少年心理服务现状

抑郁作为情绪的一部分,是心理健康问题的一个关键指标。在我国,大众对于抑郁这一心理健康问题还知之甚少,同时受制于专业的儿童精神科临床资源严重匮乏,总体心理服务资源存在巨大的不均衡。根据2020 年心理健康蓝皮书《中国国民心理健康发展报告(2019—2020)》显示,学生群体心理健康问题随着年龄增加日益突出,并呈低龄化趋势。

2 相关研究与基础

2.1 维护儿童心理健康提上重要日程

少年儿童是国家的未来、民族的希望,《全面加强和改进新时代学生心理健康工作专项行动计划(2023—2025 年)》中提出,明确学生心理健康工作的促进体系,坚持监测预警、健康教育、咨询服务、干预处置“四位一体”的工作体系,全方位保障学生心理健康。

2.2 人工智能技术与心理服务的结合

有研究表明基于计算机辅助的认知行为疗法(computer-assisted cognitive-behavioral therapy,
CCBT)可能是治疗青少年抑郁症的一种可行性方案,表明了数字疗法的可用性和可及性[2]。国外的一些大学、研究机构和心理健康组织已经开始利用自然语言处理技术来开发心理聊天机器人,如Woebot、Wysa 和Replika 等。最新的一项研究表明,通过互联网提供治疗师指导的认知行为疗法(Internet-based cognitive behavioral therapy,ICBT),可以获得与面对面认知行为疗法(cognitive-behavioral therapy,CBT)相似的临床效果[3]。同时,应该看到技术也存在一些局限性,如难以产生共情、对于复杂的语言表达难以理解其含义、不能处理复杂的问题及保持对话的连贯性等,但这些应用的出现代表了心理健康领域的一个创新趋势,就是人工智能技术有望改善心理健康服务的可及性和效率,也为后续开展相关研究指明了方向和重点。


二 研究价值及解决思路

1 可行性分析

1.1 落地场景分析

随着上海市长宁区精神卫生中心互联网医院上线,以及网上问诊等新型就医模式逐渐成熟,越来越多的人尝试通过在线方式来获取心理健康服务资源[4]。该项目主要实现的场景,首先由生成式人工智能提供知识科普、情绪支持及相关案例内容分享,然后根据来访者表述和自测量表指标进行实时评估,对于病情较轻、较标准的诉求,可引导至互联网医院平台实现免费咨询或预约线下就诊,对于病情较为紧急和严重的诉求,线下医师可进一步通过互联网医院平台发起视频干预。

1.2 技术架构设计

考虑到心理专业要求,该项目主要采纳了公开的心理咨询案例报告教材书籍等作为理论依据基础语料,通过自然语言理解与自动对话生成技术,搭建一个策略驱动的心理咨询对话大语言模型(large language model,LLM),模拟心理咨询师与来访者进行自动对话。同时,为了更好地识别问题和提供情绪支持,需要引入知识图谱情绪识别的算法,对模型的训练进行帮助。此外,量化的评价指标也是评估的重要组成部分,因此架构中还将引入专业的量表库作为评估工具。最后,为了实现服务闭环,系统与互联网医院平台打通,帮助有需要的来访者能够根据需求获得进一步的线下医疗资源,弥补线上人工智能服务的不足。

2 关键技术应用

2.1 情感识别

为了解决对话中来访者隐式情感分析问题,为大模型提供来访者情绪信息支持,该项目采用了深度学习技术,基于多视角表示学习的细粒度情感分析算法,利用卷积神经网络[5](convolutional neural network,CNN)将3 种视角下(文本、图结构、外部知识)的输入文本的语义表示进行融合,并通过多层感知机对融合后的文本表示进行情感分类。具体而言,基于多视角表示学习的细粒度情感分析算法主要通过3 个视角来学习对话文本的语义表示,其中文本视角利用基于变换器的双向编码器表示(bidirectional encoder representations from transformers,BERT)[6] 对文本进行编码,以获得句子的整体特征,见图2 ;由于目标情感的判定往往倾向于其周围近距离的词[7-8],故图结构视角采用根据单词与目标的距离构建权重图,并通过图卷积网络[9](graph convolutional network,GCN)学习获取特征;外部知识视角则通过心理情绪词典来提高模型对隐性表达文本的判定能力。

2.2 认知事理图谱构建

为解决大模型缺少正面认知信息的问题,帮助了解来访者的发生事件与认知之间的演化规律与因果逻辑,该项目采用了基于因果关系的认知事理图谱构建方法。首先,基于有向无环图(directed acyclic graph,DAG)进行文档级的事件抽取[10],获取心理咨询案例报告中的事件要素,通过设计规则模板,挖掘出事件之间存在的因果关系;其次,项目使用基于聚类的事件泛化方法,将同一类的事件抽象为1 个事件,同时“具体因果边”也被泛化成“抽象因果边”;最后,以某一事件作为中心节点,其他节点为与该事件相关的、具有代表性的原因事件和结果事件,以事件与事件之间的因果逻辑关系作为边,构建1 个基于因果关系的认知事理图谱。

2.3 自动对话的生成

基础语言模型生成的对话比较程式化,较为生硬,故心理咨询对话生成需要搭配话术及策略,以提升使用体验。该项目首先对心理咨询常用的策略进行归纳,总结了包括倾听、澄清、镜射、解析、静默、面质、具体化等策略技巧,基于此对数据集进行进一步的标注和清洗,构建出基于策略的数据集,并在此基础上做大模型的指令微调(instruction tuning)[11],利用人类反馈强化学习技术(reinforcement learning from human feedback,RLHF)[12] 训练模型,使其学习对话策略,同时借助多源外部工具,实现情绪支持、问题识别和干预方法提供等功能。


三 实现及部署

1 功能实现

该项目实现的核心是心理咨询细分领域的模型应用,要在特定领域深入模型训练,还需要完成训练数据的选择、处理、指令微调,以及人类反馈强化学习,这些训练能够使模型在心理领域的表现更为出色。

1.1 数据处理

由于心理咨询行业在国内外公开发布的相关数据集较少,目前常见的数据集大多来自一些社交网站、在线心理咨询平台或医疗博客等[13-14],并没有质量很高的开放数据。因此,为了解决现有对话数据集存在缺乏专业性与权威性的问题,并克服心理健康咨询模型生成的模糊、无意义对话的难点,该项目也尝试构建一个基于对话策略的心理健康咨询数据集。

数据处理流程包括数据切片的预处理、设计提示模板(prompt),以及基于模板的信息抽取,抽取内容涵盖对话内容、来访者状态及回复策略,最终将3 类信息构成1 条对话数据集,以此构建了一个基于对话策略的心理健康咨询对话数据集。

1.2 模型训练

考虑到上千亿参数量的通用大模型对资源要求过高,难以进行本地化部署,该项目选择对话生成语言模型(chat generative language model,ChatGLM)为基础模型。ChatGLM 是一种基于预训练的大规模语言模型(large language models,LLMs)[15],其采用双向的长短时记忆结构(long short term memory,LSTM)模型,能够更好地处理中文语法和词汇,更能捕捉到不同场景下的语言模式和个性化对话模式,从而适应不同的对话语境,生成更自然、流畅的回复,灵活满足个性化的用户需求。为适应心理咨询任务,需要对基础模型进行再训练,主要包含指令微调和强化学习两个部分。

1.2.1 指令微调

指令微调指在基础模型上进行的额外训练,使模型更好理解和生成心理咨询领域内容。首先,通过组合预先定义的指令模板获得指令集合;其次,随机组合对话数据集和指令集合中的数据构成指令微调数据集;最后,利用指令微调,对大型语言模型进行了低阶自适应模型(low-rank adaptation of large language models,LoRA)微调[16],得到了一个针对心理健康咨询的智能对话模型。相比于未经过心理健康对话数据指令微调的原LLMs。该模型能够在心理咨询对话方面表现出色,可生成一些更为可靠、权威的咨询回应。

1.2.2 强化学习

强化学习的目的是进一步加强模型的性能。通过专家评估,奖励模型行为正确,可重复训练,能够达到预期效果。为了解决基础模型在进行对话生成时缺少对话策略的问题,该项目采用了基于强化学习的对话策略,选择算法训练一个策略驱动的对话大规模语言模型LLM,利用人类反馈强化学习技术RLHF,训练大模型自动依据当前的对话场景(即来访者当前状态),选择合适的动作(即对话策略)进行回答。首先,选择一个预训练语言模型(language model,LM);其次,基于 LM 生成训练奖励模型(reward model,RM)的数据,这一模型接收一系列文本并返回一个标量奖励,数值上对应人的偏好,然后利用强化学习技术,如近端策略优化(proximal policy optimization,PPO),使用 RM 返回的奖励信号来训练语言模型。

2 部署及应用

深度学习技术能否落地与业务息息相关,对于应用场景而言,部署之前需要考虑到安全、合规、性能及接口集成等多方面的问题。

2.1 数据安全

确保来访者的数据得到妥善保护是应用部署的首要任务,需遵守医疗数据的相关法规,以保证数据的保密性安全性,例如采用使用端到端的加密以保护来访者数据,限制数据的访问权限,并确保合适的数据删除和存储策略;对于匿名及敏感数据,通过匿名和脱敏等手段确保不能识别到具体自然人身份和个人敏感信息。此外,还需预判数据集多源融合后的安全风险问题,例如,数据集A 中经过脱敏处理的数据,如通过数据集B关联后仍有开放的风险,则需要对数据主体进行统一安全规划。

2.2 性能优化

根据相关官网所提供的计算公式,如模型每日需推理指令(token)数为79 330 亿个,则推理所需运算次数为4 760×10^21,每秒浮点运算万亿次数(terafloating-point operations per second,TFLOPs),考虑推理时间以每日为单位(推理时间为86 400 秒),则对应模型推理所需算力为55×10^6TFLOPS,结合A100 有效算力78TFLOPS,得到所需图形处理单元(graphics processing unit,GPU)数量为706 315 个,对应服务器为8.8 万台。

从测算结果得知,一般医疗机构不具备如此大的算力,因此在进行特定模型部署时,应考虑性能和成本,对导出的模型进行优化,根据具体应用需求和实际硬件环境进行组合和调整,以达到最佳的性能与资源平衡。常见的模型优化包括模型压缩、量化、剪枝及模型融合等方法,架构优化则可以考虑模型并行化及批处理,将不同请求分配到不同的模型实例,不同模型部署在多个设备,保证加速推理过程,在需要快速响应时,也可通过缓存机制减少重复需求。


四 应用效果及未来展望

1 应用效果

为评估模型应用的性能,该项目随机选取了100 条测试数据对基础模型和训练后模型进行了对比实验。实验设置了2 个主要指标来进行评估,分别为基于精确率的文本生成评估指标(即代替人进行翻译结果的评估(Bilingual Evaluation Understudy, BLEU)和基于召回率 (Recall)的文本生成评估指标(Recall-Oriented Understudy for Gisting Evaluation, ROUGE),指标结果分数越高代表模型质量越好,实验分别记录了基础模型和项目训练后模型生成质量的指标分数对比。实验结果表明,该项目模型在文本生成方面表现出较高的准确性和可理解性,经过模型优化和调整后,对心理咨询问题的处理要优于基础模型。

2 未来展望

生成式人工智能技术心理咨询服务的处理上有良好的性能和泛化能力,使用自动生成对话的形式,能帮助青少年来访者克服病耻感,使其更易接受服务所传达的信息。通过对来访者对话内容的分析,可以相对准确地掌握来访者的情况全貌,结合量表等工具,提高专业人员筛查的效率。该项目证明,生成式人工智能技术在识别问题和辅助筛查方面,能够作为传统心理咨询服务的强有力补充,但就研究效果而言,应用于青少年心理咨询的生成式人工智能还处于初级阶段。随着人们对解决青少年心理健康问题需求的增强,越来越多的问题能够在求助过程中,得到实证性的分析和研究,相信随着技术更新,深度学习技术将在青少年心理咨询领域发挥更大的作用。


五 问题 

参考为什么心理问题让人心生恐惧?

《2023年度中国精神心理健康》蓝皮书中,心理问题的污名(Mental Health Stigma)可以被划分为两个类型:来自外界的社会污名,和被患者感知到并内化了的病耻感。

 心理问题的社会污名(Social Stigma)一般通过刻板印象、偏见和歧视表现出。

  • 刻板印象:指整个社会对于心理问题的一种错误的、固化的认知(如:精神分裂症患者都很危险);
  • 偏见:是社会刻板印象在认知和情感上的表现(如人们厌恶、害怕心理疾病患者,认为他们是“神经病”);
  • 歧视:是偏见在行为层面的呈现(如:人们会躲着心理疾病患者,会告诉别人离Ta远点)。

在实际生活中,目前对于精神和心理问题的错误认知是呈两极化的:要么过分轻视,认为他们只是无病呻吟,“有什么可抑郁的啊,缓缓过一阵就好了”。要么夸大甚至戏剧化,“听说他们家有亲戚是精神病,这病肯定是遗传的,你也离他远点!”。

心理问题的病耻感(Perceived Self Stigma)主要是因自己生病而产生的羞耻感(Shame)。社会给有心理问题的人打上了一个 [变态、不正常] 的烙印,然后被降格成低人一等的存在(父母不愿意自己的儿女找一个有心理疾病史的伴侣、公司更不愿意雇佣有心理疾病史的员工);患者自己似乎也接受了这种设定,认为自己得了病 [很丢人]

研究表明,心理疾病患者的病耻感要显著地高于癌症患者的。只有当人们出现注意力障碍、进食障碍、自杀等严重心理困扰时,才愿意进行心理咨询。 

参考万字长文解析Ai心理疗愈

先问问自己,有没有在情绪不好的时候,寻求专业心理机构或者人士的帮助?如果有的话,比例高不高?

 单次咨询费最少300每小时,一个疗程至少需要10~20治疗次数,也就是3000~6000的纯现金支出并且没有医保的垫付。  

中国家庭人均月收入在 5000 以下的有95%。那么为什么要掏空我一个月的收入,去做一个完全不知道效果的心理疗愈? 

  • 对于轻度需求场景:生活里大多数的负面情绪,其实本就不需要疗愈和干预,每个成年人学会和这些压力,学会和自身的负面情绪共存,本就是一个必备的技能。不是所有的情绪不好都需要疗愈,当然有更好,没有也能自己扛过来。
  • 对于中度需求场景:需求端用户本身的认知决定他是否会想寻找相关领域,俗话说“小病拖大病挨,临死才往医院抬”。
  • 对于重度需求场景:已经确诊就医的用户被迫接受医院的诊断与药方,依然有相当大的比例,从心底里是抗拒。

贯穿所有场景下,因为付费能力导致需求无法承担的问题,精神障碍是个经典的富贵病。 

传统咨询场景中,受限于服务提供方式,咨询师与来访者约定固定时间会诊以及咨询频率,大部分的服务提供场景都有计划且按部就班。而深夜网抑云的现象则反应了,用户情绪上涌,崩溃,极端情绪的场景是非常随机且不受控的。在那些极端情绪涌来的场景下,用户其实最需要的是疗愈陪伴的深夜,却是传统咨询服务无法触达到的时间段。由此引申开来的是疗愈赛道里的特殊场景:更像是急诊而非门诊

情感疗愈类产品因为不是和真人交流,极大的缓解了用户的病耻感。此类产品提供的是情绪价值,在沟通聊天的过程中情绪流淌的服务(数据,可能会是当前Ai疗愈模型的胜负手)

  • 24
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

瑞雪兆我心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值