心理健康数据集:mental_health_chatbot_dataset

一.数据集描述
1.数据集摘要
  该数据集包含与心理健康相关的问题和答案的对话对,以单一文本形式呈现。数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源精选而来的。所有问题和答案都经过匿名化处理,以删除任何个人身份信息(PII),并经过预处理以删除任何不必要的字符。
2.语言
  数据集中的文本是英文。

二.数据集结构
1.数据实例
  一个数据实例包括一个文本列,其中包含了患者和医疗提供者之间的问题和答案的对话。问题是由患者提出的,答案是由医疗提供者提供的。如下所示:

"<HUMAN>: What is a panic attack? <ASSISTANT>: Panic attacks come on suddenly and involve intense and often overwhelming fear. They’re accompanied by very challenging physical symptoms, like a racing heartbeat, shortness of breath, or nausea. Unexpected panic attacks occur without an obvious cause. Expected panic attacks are cued by external stressors, like phobias. Panic attacks can happen to anyone, but having more than one may be a sign of panic disorder, a mental health condition characterized by sudden and repeated panic attacks."

翻译中文,如下所示:

"<HUMAN>: 什么是惊恐发作? <ASSISTANT>: 惊恐发作突然发作,伴随着强烈且常常不可抑制的恐惧。它们伴随着非常具有挑战性的身体症状,如心跳加快、呼吸急促或恶心。突发的惊恐发作没有明显的原因。而预期的惊恐发作是由外部应激因素引起的,比如恐惧症。惊恐发作可能会发生在任何人身上,但多次经历可能是惊恐症的迹象,这是一种以突然和反复的惊恐发作为特征的心理健康状况。"

2.数据字段
  ‘text’:患者和医疗提供者之间的问题和答案的对话。

三.数据集创建
1.策展理由
  聊天机器人为寻求支持的个人提供了一个随时可用且易于访问的平台。它们可以随时随地访问,为需要帮助的人提供即时支持。聊天机器人可以提供共情和非判断性的回应,为用户提供情感支持。虽然它们无法完全替代人际互动,但它们可以是一个有用的补充,尤其是在困难时刻。因此,这个数据集被策划出来,以帮助使用这个自定义数据集微调会话式AI聊天机器人,然后可以部署并提供给最终患者作为聊天机器人。
2.数据源
  该数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源策划而来的。
3.个人和敏感信息
  该数据集可能包含与心理健康相关的敏感信息。所有问题和答案都经过匿名化处理,以删除任何个人身份信息。

参考文献:
[1]mental_health_chatbot_dataset:https://huggingface.co/datasets/heliosbrahma/mental_health_chatbot_dataset
[2]https://github.com/iamarunbrahma/finetuned-qlora-falcon7b-medical
[3]Fine-tuning of Falcon-7B Large Language Model using QLoRA on Mental Health Conversational Dataset:https://medium.com/@iamarunbrahma/fine-tuning-of-falcon-7b-large-language-model-using-qlora-on-mental-health-dataset-aa290eb6ec85
[4]train/loss for Falcon-7B PEFT model:https://wandb.ai/heliosbrahma/huggingface/reports/train-loss-for-Falcon-7B-PEFT-model–Vmlldzo1MDQxMDAy?accessToken=fi8s1lrhuwjlloumbxbmd3mm9h138nmu0b03szmir9fyqqs8wlev72878yd97ctn

在全球范围内,随着现代生活节奏的加快和压力的增加,人们对心理健康问题的关注日益增加。焦虑、抑郁、压力等心理健康问题日益突出,呼吁更加深入的调查和理解。 本数据集记录了一项追踪心理健康趋势的全球调查。该调查涉及来自不同人口背景的受访者,包括性别、就业状况和地理区域,旨在更好地了解特定时间段内全球心理健康的变化。数据涵盖了一系列变量,如压力、抑郁、焦虑、主观幸福感和心理健康服务的使用水平。 Timestamp 受访时间 Gender 受访者性别 Country 受访者居住的国家 Occupation 受访者的职业 self_employed 受访者是否为自雇人士? family_history 受访者的家庭中是否有精神健康障碍史? treatment 受访者是否接受过心理健康问题的治疗? Days_Indoors 受访者每周待在室内的估计天数。 Growing_Stress 受访者当前感受到的压力程度 Changes_Habits 受访者的睡眠习惯或模式有任何变化吗? Mental_Health_History 受访者以前是否有精神健康障碍史? Mood_Swings 受访者是否经历过突然的情绪波动? Coping_Struggles 受访者在应对压力或压力方面有困难吗? Work_Interest 受访者对工作的兴趣和积极性 Social_Weakness 受访者是否觉得很难进行社交互动或维持关系? mental_health_interview 受访者是否愿意接受心理健康访谈? care_options 受访者是否意识到或正在使用心理保健方案?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

NLP工程化

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值