simpleT5 项目使用教程
simpleT5项目地址:https://gitcode.com/gh_mirrors/si/simpleT5
项目介绍
simpleT5 是一个基于 PyTorch-lightning 和 Transformers 的开源项目,旨在让用户能够快速训练 T5 模型。T5 模型是一种强大的文本到文本转换模型,适用于多种自然语言处理任务,如摘要、问答、翻译和文本生成等。
项目快速启动
安装
首先,创建一个新的 Python 环境并安装 simpleT5:
pip install --upgrade simplet5
使用示例
以下是一个简单的示例,展示如何使用 simpleT5 进行摘要任务:
from simplet5 import SimpleT5
# 实例化模型
model = SimpleT5()
# 加载预训练模型
model.from_pretrained("t5", "t5-base")
# 训练模型
model.train(
train_df=train_df, # pandas dataframe with 2 columns: source_text & target_text
eval_df=eval_df, # pandas dataframe with 2 columns: source_text & target_text
source_max_token_len=512,
target_max_token_len=128,
batch_size=8,
max_epochs=5,
use_gpu=True,
outputdir="outputs",
early_stopping_patience_epochs=0,
precision=32
)
# 加载训练好的 T5 模型
model.load_model("t5", "path/to/trained/model/directory", use_gpu=False)
# 预测
prediction = model.predict("input text for prediction")
print(prediction)
应用案例和最佳实践
摘要生成
simpleT5 可以用于生成文本摘要。以下是一个示例:
from simplet5 import SimpleT5
model = SimpleT5()
model.from_pretrained("t5", "t5-base")
# 假设我们已经训练好模型并保存
model.load_model("t5", "path/to/trained/model/directory", use_gpu=False)
input_text = "The quick brown fox jumps over the lazy dog."
summary = model.predict(input_text)
print(summary)
翻译任务
simpleT5 也可以用于翻译任务:
from simplet5 import SimpleT5
model = SimpleT5()
model.from_pretrained("t5", "t5-base")
# 假设我们已经训练好模型并保存
model.load_model("t5", "path/to/trained/model/directory", use_gpu=False)
input_text = "Hello, how are you?"
translation = model.predict(input_text)
print(translation)
典型生态项目
HuggingFace Transformers
simpleT5 基于 HuggingFace 的 Transformers 库,这是一个广泛使用的自然语言处理库,提供了大量的预训练模型和工具。
PyTorch Lightning
PyTorch Lightning 是一个轻量级的 PyTorch 框架,旨在简化深度学习模型的训练过程。simpleT5 利用 PyTorch Lightning 来管理训练循环和硬件加速。
通过结合这些生态项目,simpleT5 提供了一个高效且易于使用的平台,用于快速训练和部署 T5 模型。