ChatDoctor 模型部署与使用指南
ChatDoctor项目地址:https://gitcode.com/gh_mirrors/ch/ChatDoctor
1. 项目目录结构及介绍
以下是 ChatDoctor
开源项目的基本目录结构及其作用:
ChatDoctor/
├── Autonomous_ChatDoctor_csv/
│ ├── chat_csv.py # 基于CSV数据集的聊天交互脚本
├── Autonomous_ChatDoctor_Wikipedia/
│ ├── chat_wiki.py # 基于维基百科数据集的聊天交互脚本
├── Autonomous_ChatGPT_API/ # 使用ChatGPT API的相关代码
├── pretrained/ # 预训练模型存放位置
├── figfig # 图像相关资源
├── requirements.txt # 项目依赖包列表
├── train.py # 训练模型的主要脚本
├── train_lora.py # 特定适配器训练脚本
└── utils.py # 工具函数
Autonomous_ChatDoctor_csv
和Autonomous_ChatDoctor_Wikipedia
:分别包含基于不同数据集的聊天交互脚本。pretrained
:存放预训练模型权重。requirements.txt
:列出项目运行所需的所有Python库。train.py
和train_lora.py
:用于训练和微调模型的脚本。utils.py
:提供辅助功能和通用工具。
2. 项目启动文件介绍
2.1 chat_csv.py
这个文件提供了一个命令行界面,让您可以使用预先收集的医疗对话CSV数据集与ChatDoctor模型进行互动。要运行此脚本,您需要确保已安装了所有依赖项并在激活的PyTorch环境中执行以下命令:
python chat_csv.py
2.2 chat_wiki.py
这个脚本允许您使用来自维基百科的数据与ChatDoctor模型进行交互。同样,确保环境准备就绪后,通过终端输入:
python chat_wiki.py
3. 项目的配置文件介绍
ChatDoctor
项目中的配置主要在运行脚本时通过命令行参数传递。以下是几个关键参数的例子:
--model_name
: 指定模型名称或路径。--temperature
: 控制生成回复的多样性。--top_k
: 只考虑前k个最可能的词汇进行生成。--top_p
: nucleus sampling时保留的概率总和。--repetition_penalty
: 防止重复短语的惩罚系数。--length_penalty
: 回复长度的惩罚因子。--early_stopping
: 是否在达到最大长度之前提前结束。--max_length
: 最大生成响应的长度。--min_length
: 最小生成响应的长度。
例如,如果您想指定一个模型、温度和最大长度,可以这样运行:
python chat_csv.py --model_name my_model --temperature 0.7 --max_length 256
请注意,不是所有的配置都在单独的JSON或YAML配置文件中,而是通过命令行参数直接传递给脚本。为了定制更多的设置,您需要修改脚本中的相应部分或者创建自己的脚本来添加新的配置选项。
完成这些步骤后,您就可以开始探索和使用ChatDoctor模型了,它能够根据提供的医疗知识对用户的健康问题提供智能回应。但是要注意,该模型尚未达到100%的准确性,不应用于真实的临床场景。