z1123592075-CSDN博客

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（七）

当我们谈论分类模型的性能评估时，"Accuracy"（准确率）是一个常见的指标。它衡量了模型在所有预测中正确预测的比例。具体而言，准确率通常被定义为模型正确预测的样本数与总样本数之比。假设一个分类模型对于一个数据集中的样本进行了预测，正确预测的样本数为 ( N_{correct} )，总样本数为 ( N_{total} )，则准确率 ( Acc ) 可以用以下公式表示：准确率的取值范围在 0 到 100 之间，表示的是模型预测正确的百分比。

2024-06-23 20:42:08 467

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（六）

本阶段任务为使用训练完成的模型进行推理预测。

2024-06-23 20:33:06 301

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（五）

单机多卡（Single Machine Multi-GPU）是指在一台计算机上使用多个 GPU 进行并行计算或训练深度学习模型。这种方法能够显著加速计算过程，因为多个 GPU 可以同时处理数据，提高计算资源的利用率。可见，nn.DataParallel()提供了一键数据并行的方法，使得我们能较为方便的实现多卡并行的训练策略。通常，我们在多卡条件下优先选择数据并行的方式即nn.DataParallel()。为最大化利用计算资源以提高训练效率，我们使用了实验室提供的单机多卡的资源环境。

2024-06-23 20:04:40 204

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（四）

首先，我们需要创建一个自定义训练器类，以便使用分布式采样器进行数据加载。这个类确保训练和评估数据集在分布式环境下能够正确地被采样和加载。

2024-06-23 19:55:21 149

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（三）

因为实验室服务器安全配置与其网络拓扑结构限制等原因，docker的端口默认只开放对应用户的ssh端口，其他端口能开放，但在服务器外网中无法访问该端口。于是我们最开始选择的是内网穿透的形式将实验室服务器的端口暴露出来，供前端访问。

2024-06-23 19:45:18 686

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（二）

定义函数，从check point加载训练好的模型其中use_bf16为半精度加载模式，可节约大量显存占用（约50%），但同时也可能会损失推理精度。将模型的加载部署、推理等调用都封装为class model_interface的方法：generate方法：其中定义了 img_processor类，用于接收前端发送的base64编码图片，并将其保存为本地缓存图片，以供模型访问后续生成。类定义如下：类中方法解释如下初始化 (方法):base64_as_img 方法:save_imag

2024-06-23 19:35:33 569

原创山东大学软件学院创新实训：角色疆界 - 智能电影角色扮演对话大模型（一）

本项目中我们选择了mPLUG-Owl模型作为我们的base model。

2024-06-23 19:28:49 132

z1123592075的博客