API Token
获取
获取方式参考:
Hugging Face的API token获取方式指南
文本摘要
- 使用
distilbart-cnn
模型构建了一个文本摘要应用。该模型专门用于文本摘要任务。 - 使用
Gradio
创建了一个简单的用户界面,允许用户输入文本并生成摘要。 - 使用了一个
BERT
模型构建了一个命名实体识别应用。该模型可以识别文本中的人名、地名和机构名实体。使用Gradio
创建了一个用户界面,显示了带有实体高亮的原始文本。
小型专家模型
- 相比大型通用语言模型,小型专家模型在特定
NLP
任务上的效果可以一样好。
小型模型计算速度更快,部署使用更高效。大型模型计算资源消耗大,响应速度慢。 - 小型模型训练成本更低。大型模型需要大量数据、计算资源和时间来训练。
本课使用的DistilBART
和BERT
模型都是小型专家模型。DistilBART
是BART
的蒸馏版本,专为文本摘要任务设计。BERT
经过微调,非常适合命名实体识别。
小型模型往往是通过知识蒸馏从大型模型中学习而来,能够保留大型模型的