- 博客(104)
- 资源 (18)
- 收藏
- 关注
原创 基于深度学习的情绪识别检测系统【完整版】
多模态情绪识别融合人脸、语音等多源数据,通过CNN、LSTM等模型提取视觉(表情)与听觉(语音语调)特征,经融合算法综合分析情绪。可实现图片、视频、实时摄像头的静态/动态检测,输出情绪类别及百分比,提升复杂场景识别精度,广泛应用于智能交互、心理分析等领域。
2025-05-26 14:20:13
8583
9
原创 UViT-Seg:一种基于 ViT 和 U-Net 的高效框架,用于在结肠镜检查和 WCE 图像中准确分割结直肠息肉(Python代码实现+完整论文+数据集+UI界面)
U-Net 最初由 Ronneberger 等人 [20] 引入,用于生物医学图像分割,作为各种图像分割任务的首选架构而广受欢迎。这种架构植根于全卷积网络的基础 [48U-Net 模型包括两个关键组件:编码器和解码器路径。编码器的作用是使用一系列具有 3x3 滤波器的卷积层提取深度特征,然后是 ReLU 激活层和 MaxPooling 层。相反,解码器负责创建输出分割映射,采用上采样、卷积、ReLU 激活和 MaxPooling 层等作。
2025-03-06 13:59:58
1910
原创 基于深度学习的人脸情绪识别检测系统(VGG、CNN、ResNet)
代码包括了人脸情绪识别模型训练版块,算法版块(CNN、VGG、ResNet)三种。有每一种算法的测试代码。其次,人脸情绪识别的训练数据有Kaggle和自行采集本地数据2种方式。有UI界面,实时检测人脸情绪变化,以及不同的人脸情绪百分比。
2023-09-20 16:27:27
25595
67
原创 课堂情绪识别系统技术实现
在当前教育信息化快速发展的背景下,学生心理健康问题日益受到广泛关注。传统的心理健康评估方式存在主观性强、时效性差、覆盖范围有限等局限性。基于人工智能技术的课堂情绪识别与心理健康监测系统,能够通过非接触式的方式实时分析学生在课堂中的情绪状态,为教师提供客观的数据支持,实现早期预警和及时干预。本系统整合了计算机视觉、语音分析、自然语言处理等多模态技术,构建了一套完整的情绪识别与心理健康评估体系。
2026-02-22 17:49:12
667
原创 多模态情绪识别技术全解析
情绪识别作为人工智能领域的重要研究方向,长期以来主要依赖于单一模态的信息分析。然而,人类情绪的表达具有天然的——面部表情、语音语调、肢体语言和文本内容共同构成了情绪表达的完整图谱。传统的单模态情绪识别方法往往存在和的问题,导致识别准确率受限。多模态情绪识别技术通过整合来自不同感官通道的信息,实现了对情绪状态的。这种技术不仅能够捕捉更丰富的情绪特征,还能在不同模态信息间建立,显著提升了情绪识别的鲁棒性和准确性。
2026-02-22 17:44:39
768
原创 生成式人工智能(What is Generative AI?)
import osdf.head()df.info()Datetime...1011Datetimeplt.show()else:As ...scale = 3,if title:plt.show()
2026-01-15 19:32:05
987
原创 用于抑郁分析的多模态数据集「第二期」
本文介绍了三种用于心理健康研究的专业数据集:(1)多模态情感语音歌曲数据集,包含24位演员288段3秒录音,标注8种情绪;(2)抑郁症音频数据集,含400个.wav格式语音样本,按抑郁程度分类;(3)抑郁脑电数据集,采集30名患者的任务态脑电信号,研究大脑活动模式。这些数据集均支持机器学习在情绪识别、抑郁检测等心理健康领域的应用,为多模态研究、语音分析和神经信号处理提供基础资源。
2025-11-16 20:23:00
494
原创 采用 MediaPipe 框架构建手势检测模型
本文提出 5 类手语手势分类方法:采用 MediaPipe 提取 125 张图像的 21 个手部关键点,构建 63 维特征向量;设计含 Dropout 正则化的轻量化全连接神经网络(18,693 参),结合早停策略训练。实验显示,模型训练集与验证集准确率均达 100%,训练损失 0.0143、验证损失 0.0051;3×3 网格可视化验证了关键点标注与预测标签的精准匹配。该方法适配小样本场景,为手语识别轻量化部署提供支撑。
2025-11-13 14:06:19
1031
原创 关于胸部X射线图像检测肺炎数据集补充
摘要:卡塔尔大学等机构联合发布了COVID-QU-Ex数据集,包含33,920张胸部X光图像(11,956例COVID-19、11,263例其他肺部感染和10,701例正常),并提供了配套的肺部掩模分割数据。该数据集通过多阶段更新完善,是目前最大的COVID-19胸部影像数据集之一,可用于感染检测、定位和严重程度评估研究。数据集整合了来自7个COVID-19数据源和3个非COVID数据源的影像资料,相关成果已发表于多篇学术论文。研究者将持续更新数据以支持COVID-19诊断研究。
2025-11-11 15:33:48
848
原创 基于YOLO的深度学习框架用于从胸部X射线图像检测肺炎
本研究提出一种基于YOLOv11深度学习框架的肺炎实时检测系统,通过整合Grad-CAM实现视觉可解释性。系统采用CLAHE增强对比度、ROI提取和肺部分割等预处理技术,在两个公开数据集上表现优异:COVID-19数据集上准确率98.50%、F1分数97.99%,胸部X光数据集上准确率98.06%、F1分数98.06%。Grad-CAM可视化能够准确突出病理区域,提升了模型临床适用性。与现有方法相比,该系统在准确率和透明度方面具有优势,结合实时处理能力和可解释输出,成为支持肺炎与COVID-19诊断的可靠工
2025-11-11 15:14:28
761
原创 [特殊字符]用于糖尿病视网膜病变图像生成的生成对抗网络(GAN)
摘要:本研究基于TensorFlow构建了一个生成对抗网络(GAN),用于生成糖尿病视网膜病变(DR)图像。该网络采用ResNet架构的生成器和判别器,使用Kaggle糖尿病视网膜病变数据集(2750张图像,5类分级)。图像预处理调整为128×128×3尺寸并归一化。生成器通过转置卷积和残差块上采样噪声向量,判别器通过残差块下采样进行真伪判断。训练80个epoch后,生成器损失3.71,判别器损失0.02。评估显示生成图像被预训练CNN分类器识别为健康眼(80%准确率)和中度DR(53%)。研究证明了GAN
2025-11-06 09:04:22
710
原创 人脸情绪识别数据集「分享第一期」
本文介绍了一个用于面部情绪识别的混合数据集,整合了FER2013和RAFDB数据集。数据集包含7类情绪(愤怒、厌恶、恐惧、快乐、中立、悲伤、惊喜)的RGB面部图像,采用HaarCascade等技术预处理(置信度0.8),降低了噪点。该数据集组织清晰,每个情绪类别存储在独立文件夹中,图像为可变分辨率的.jpg文件,可直接用于CNN等深度学习模型训练。使用需注意类不平衡问题,适合配合PyTorch/TensorFlow等框架使用。数据集通过网盘分享,提取码8888。
2025-11-06 08:42:58
492
原创 精准且快速校准的语音神经假体研究与学习
经过 1.4 小时的额外系统训练,神经假体使用 125,000 个单词的词汇量达到了 90.2% 的准确率。通过进一步的训练数据,神经假体在手术植入后的 8.4 个月内保持了 97.5% 的准确率,参与者使用它以每分钟约 32 个单词的速度进行自定进度的对话,累计超过 248 小时。
2025-10-31 21:21:54
961
原创 基于多模态手语与情感识别系统
多模态识别系统,该系统通过MediaPipeHolistic技术实时跟踪人体特征点(面部、手部和姿态),实现手语到文本转换及情感识别功能。系统核心包括三个模块:手语识别模块处理肢体动作特征点,情感识别模块分析面部特征点序列,综合预测模块融合双模型输出。技术架构基于TensorFlow/Keras框架,采用数据增强、早停机制和学习率调整等优化策略。MP_Data数据集提供标准化特征点数据,包含3种手语动作类别各50个序列,支持模型训练与验证。最终系统可为每帧视频提供手
2025-10-29 11:00:09
764
原创 2026届计算机类本硕选题参考(项目代码已实现)
本文摘要整理了150个计算机领域研究课题,涵盖六大方向: 人工智能与大模型(30项):包括轻量化模型压缩、多模态生成、医疗问答系统、内容溯源等技术; 数据科学与大数据(30项):涉及实时流处理、隐私计算、用户画像、舆情分析等应用; 云计算与分布式系统(25项):聚焦容器化部署、边缘计算、微服务架构等优化方案; 网络安全与区块链(25项):探索智能合约安全、数据溯源、隐私保护等创新应用; 计算机视觉与物联网(20项):包含工业检测、AR/VR、智能家居等系统开发; 软件开发与工程(20项):涵盖微服务电商平台
2025-10-23 17:20:03
1246
原创 多模态情绪识别 200 + 毕业设计题目清单(代码和项目文档主页联系我)
多模态情绪识别研究综述:本文系统梳理了多模态情绪识别领域的研究进展,涵盖四大主题:(1)方法论创新,包括多模态大模型优化、轻量化设计和可解释性增强;(2)模态融合机制创新,探索新兴生理信号和先进融合策略;(3)前沿应用场景,如智慧医疗、智能交通和教育领域;(4)技术挑战与伦理问题,涉及数据标注、跨域泛化及隐私保护。研究呈现向高效轻量化、鲁棒可解释、跨领域融合的发展趋势,同时强调伦理规范与隐私保护的重要性。
2025-10-20 14:36:06
729
原创 全球地震-海啸风险评估数据集用于风险评估的地震特征和海啸分类数据集
全球地震-海啸风险评估数据集包含2001-2022年782次重大地震的完整记录(无缺失值),涵盖震级(6.5-9.1级)、震源深度等13个特征,其中38.9%为海啸事件。该数据集支持Geo-RBF核回归等机器学习方法,通过融合地理距离(经纬度)与地震参数,实现海啸波高预测和风险等级划分(低/中/高风险)。核心模型训练显示R²达0.87,可有效支持实时预警和灾害评估。数据完整性和地理空间特性使其特别适用于防灾决策系统开发。
2025-10-20 13:22:19
1104
6
原创 手撕语音情绪识别项目之深度学习项目python版本
CREMA-D 是一个演员表演众包标注的多模态情绪数据集,专门用于研究多模态情绪的表达和感知。
2025-09-22 16:33:41
851
原创 Emotion-LLaMA: 用于多模态情感识别与推理的创新模型(python代码已实现)
Emotion-LLaMA,这是一种通过特定于情感的编码器无缝集成音频、视觉和文本输入的模型。通过将特征对齐到共享空间中并采用改进的 LLaMA 模型和指令调整,Emotion-LLaMA 显着增强了情感识别和推理能力。
2025-07-07 21:24:25
2101
1
原创 用于构建多模态情绪识别与推理(MERR)数据集的自动化工具
项目是一个用于构建多模态情感识别与推理(MERR)数据集的自动化工厂,它能够处理多种类型的多媒体数据,并进行情感分析和推理。以下是该项目的主要功能:✨ 功能特性视频和音频处理需要 FFmpeg。安装:验证安装:ffmpeg -versionffprobe -version2. OpenFace面部作单元提取需要 OpenFace。安装:克隆 OpenFace 存储库:git clone https://github.com/TadasBaltrusaitis/OpenFace.git
2025-07-07 19:17:47
1295
原创 DEAPDataset的EEG脑电图数据(Emotion_Prediction)使用介绍【第一期】
记录了 32 名参与者的脑电图 (EEG) 和外周生理信号,每人观看了 40 个一分钟长的音乐视频摘录。参与者根据唤醒、效价、喜欢/不喜欢、支配和熟悉度的水平对每个视频进行评分
2025-06-25 16:59:54
1272
原创 超论文解读:一种用于不确定性感知多模态情绪识别的概率框架(潜在分布解耦)python算法已实现
一种用于不确定性感知多模态情绪识别的概率框架图一:全文框架结构思维导图预览问题:多模态多标签情感识别(MMER)需从音频、文本、视频中识别共存情感,但现有方法忽略偶然不确定性(数据固有噪声),导致特征模糊和模态融合失效。方法:提出LDDU框架,通过潜在情感空间的概率建模解决:对比解耦分布机制:将多模态数据建模为高斯分布,分离语义特征与不确定性。不确定性感知融合:根据分布分散程度动态整合模态信息。结果:在CMU-MOSEI和M³ED数据集上达到SOTA(CMU-MOSEI的mi-F1提升4.3%)。
2025-06-21 19:28:30
1015
原创 免费1000套编程教学视频资料视频(涉及Java、python、C C++、R语言、PHP C# HTML GO)
免费1000套编程教学视频资料视频(涉及Java、python、C C++、R语言、PHP C# HTML GO)
2025-06-21 15:19:39
2631
1
原创 语音情感识别:CNN-LSTM 和注意力增强 CNN-LSTM 模型的比较分析
NN-LSTM 模型和注意力增强 CNN-LSTM 模型。这些模型在 2015 年至 2018 年间收集的瑞尔森情感言语和歌曲视听数据库 (RAVDESS) 上进行了测试,该数据库包括 1440 个男性和女性演员表达八种情绪的音频文件。这两个模型在将情绪分为八类方面都取得了令人印象深刻的超过 96% 的准确率。
2025-06-19 23:24:43
1313
原创 利用面部情绪识别和AI技术给中老年人推荐电影,故事,音乐和生成图片
本项目在老年人医疗保健中创新应用面部识别技术,通过分析视频面部表情每5秒提取情绪并分类,利用自有数据集训练的模型处理评估,将情绪存时间序列数据库生成报告可视化,结合后端脚本、外部API及API控制器,形成全面情感关怀方案,提升老年人情感福祉
2025-06-17 17:31:56
1661
原创 Parallel is All You Want:通过并行化 CNN 和 Transformer 编码器来组合语音情感的空间和时间特征表示
在本笔记本中,我将以我的 Intro to Speech Audio Classification 存储库为基础,并使用 Transformer 编码器网络并行构建两个并行卷积神经网络 (CNN) 来对音频数据进行分类。我们正在研究 RAVDESS 数据集,以对 8 类之一的情绪进行分类。我们将 CNN 用于空间特征表示,将 Transformer 用于时间特征表示。我们通过增加数据集的变化来减少过度拟合,从而增强训练数据;我们使用加性高斯白噪声 (AWGN) 将 RAVDESS 数据集增强三倍,总共有 4
2025-06-16 22:33:56
1113
原创 基于Streamlit和双模态的语音情绪识别系统(SER)
一个基于深度学习的多功能分析平台,能够通过上传音频文件或直接录音的方式,智能识别语音中蕴含的情感状态。系统提供三种情感分类模式(3类基础情感、6类标准情感和7类细化情感),采用双模态分析技术(MFCC声学特征+梅尔频谱图视觉特征)确保识别准确率,并通过直观的极坐标可视化图表展示情感分布和置信度。
2025-06-16 14:59:23
1692
原创 EffRes-DrowsyNet:结合 EfficientNetB0 与 ResNet50 的新型混合深度学习模型用于驾驶员疲劳检测算法实现
EffRes-DrowsyNet混合深度学习模型,结合EfficientNetB0与ResNet50的优势,在驾驶员疲劳检测任务中表现卓越。模型在SUST-DDD数据集上达到97.71%准确率,在YawDD和NTHU-DDD数据集分别取得92.73%和95.14%的准确率。通过融合手工特征(EAR/MAR)与深度特征,模型实现了计算效率与检测精度的平衡。
2025-06-14 13:58:17
1625
原创 freeCodeCamp.org 的开源代码库和课程
freeCodeCamp.org是一个非营利性编程学习平台,提供12项免费技术认证课程,涵盖全栈开发、数据科学和机器学习等领域。平台采用自定进度学习模式,包含3000+小时交互式编程练习和50个实战项目,每个认证需约300小时完成。课程特色包括自动化测试、真实项目开发及学术诚信保障,已帮助4万余人进入科技行业。认证内容从基础HTML/CSS到高级Python、机器学习,完成6项核心认证后可申请全栈开发认证,相当于1800小时编程训练。所有认证永久有效,可作为求职资质证明。
2025-06-13 16:34:51
1063
原创 ByteTrack:通过关联每个检测框实现多目标跟踪
本文提出了一种改进的多目标跟踪方法ByteTrack,通过关联所有检测框(包括低分检测框)而不仅限于高分检测框,解决了物体遮挡导致的轨迹缺失问题。该方法利用检测框与tracklet的相似性来区分真实物体和背景,在多个基准测试(MOT17、MOT20等)上实现了SOTA性能,首次在MOT17测试集上达到80.3 MOTA、77.3 IDF1和63.1 HOTA,同时保持30FPS实时速度。论文还介绍了基于PaddleDetection的实时跟踪系统PP-Tracking,支持多种应用场景和部署方式。源代码和模
2025-06-13 16:20:05
1131
原创 MultiTalk 是一种音频驱动的多人对话视频生成模型
MultiTalk是一种创新的音频驱动多人对话视频生成框架,能创建包含真实对话、歌唱表演和交互控制的视频内容。该系统支持480p/720p分辨率输出,最长可生成15秒视频,并能处理卡通人物和真人角色的生成。其核心技术包括Label Rotary Position Embedding(L-RoPE)方法,解决了多音频流与人物绑定的难题,同时保持基模型的指令跟随能力。相比现有方法,MultiTalk在说话头像、说话身体和多人对话数据集上都展现出更优越的生成效果。该框架通过音频交叉注意力层和多任务训练策略,实现了
2025-06-13 15:54:48
1958
原创 2023 年 PYTORCH[特殊字符]深入课程
89.2 PyTorch 注意力 Transformer 模型构建。98.2 PyTorch Transformer NLP 模型构建。69.2 PyTorch Transformer模型构建。77.2 PyTorch图Transformer模型构建。100.2 PyTorch VAE 异常检测模型构建。67.2 PyTorch StyleGAN模型构建。79.2 PyTorch NLP持续学习模型构建。90.2 PyTorch 小样本语义分割模型构建。92.2 PyTorch NLP 半监督模型构建。
2025-06-02 17:43:54
1353
原创 基于回归算法的心理健康预测(EDA + 预测)
心理健康涵盖、心理与社会福祉,影响认知、情绪和行为模式,决定压力应对、人际交往及健康决策,且在生命各阶段(从童年至成年)均至关重要。本笔记本将先用 Plotly 库全面分析多组数据,再以回归算法选定目标变量建模,聚类分析则留待下一笔记完成,现正式开启分析。
2025-06-02 01:48:52
962
原创 焦虑和抑郁患者学生分类模型的研究
“通过文本分析识别心理状态” 的研究逻辑一致 —— 自然语言处理(NLP)技术确实能通过挖掘文本中的语义特征(如负面词汇频率、情感极性)有效捕捉抑郁相关的语言模式(如参考资料中提及的 “restless”“anxious” 等高频词)。
2025-06-02 00:16:10
1026
原创 图解AI三大核心技术:RAG、大模型、智能体【推荐文章】
转载的原文链接:图解AI三大核心技术:RAG、大模型、智能体如有需求联系作者删除,谢谢!!!!!
2025-06-01 12:50:06
375
原创 基于多模态脑电、音频与视觉信号的情感识别算法【Nature核心期刊,EAV:EEG-音频-视频数据集】
DatabaseLanguageSubjectsTypesS, ISEED-IV11EEG and EMVideosS, IDREAMER10EEG & ECGMoviesS, IMPED9VideosS, IASCERTAIN8VideosS, IAMIGOS7MoviesS, IDEAP12S, IIEMOCAP15EnglishS, ISEMAINE16EnglishS, INNIME19ChineseP, NRAVDESS20。
2025-05-29 17:18:05
2075
原创 适用于 Windows 和 Linux 的 Yolo全栈算法之开源项目学习
本文介绍了YOLO系列目标检测算法的相关信息和使用指南。主要内容包括: YOLOv7、v4等最新版本的性能比较,YOLOv7在速度和精度上均超越其他实时检测器。 如何在Windows/Linux上安装Darknet框架,编译运行YOLO模型。 训练自定义数据集的具体步骤:准备标注数据、配置参数、调整网络结构等。 模型评估方法,包括mAP计算和FPS测试。 多种应用场景下的使用示例,如图片检测、视频流处理等。 不同硬件平台上的优化方案,包括GPU加速和量化部署。 API调用方式,支持C++/Python等语言
2025-05-28 15:05:02
1435
Python图像处理PCA算法完整源码
2019-11-05
企业人事管理系统.zip
2019-06-05
C#入门经典教程.ppt
2019-05-15
智能医疗诊断协助系统演示(LLM,RAG,Agent)
2025-05-20
参考论文1:SSDA-YOLO: SEMI-SUPERVISED DOMAIN ADAPTIVE YOLO FOR CROSS
2024-06-04
粒子群算法优化及在TSP中的应用
2023-08-24
肿瘤分割与识别(python实现)
2023-08-24
心电信号处理及可视化系统设计(python)
2023-08-24
基于Python的电脑配件管理系统的设计与实现
2023-08-23
基于遗传算法的旅行商问题优化求解(python)
2023-08-24
单词学习系统设计与实现(python)
2023-08-24
基于蚁群算法的机场除冰车调度问题(源码QQ:2551931023)
2023-08-23
基于 AR 图像识别的算法研究与应用(python实现)
2023-08-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅