- 博客(6)
- 收藏
- 关注
原创 大模型学习课程-Datawhale-LLMCookbook-聊天机器人(Deepseek API 替代方案)
此处我们另外要求模型创建一个 JSON 摘要,方便我们发送给订单系统。因此我们需要在上下文的基础上追加另一个系统消息,作为另一条指示 (instruction)。我们说创建一个刚刚订单的 JSON 摘要,列出每个项目的价格,字段应包括 1)披萨,包括尺寸,2)配料列表,3)饮料列表,4)辅菜列表,包括尺寸,最后是总价格。此处也可以定义为用户消息,不一定是系统消息。请注意,这里我们使用了一个较低的温度,因为对于这些类型的任务,我们希望输出相对可预测。
2025-06-05 18:52:07
746
原创 大模型学习课程-Datawhale-LLMCookbook-推断(Deepseek API 替代方案)
在这节课中,你将从产品评论和新闻文章中推断情感和主题。。
2025-06-05 16:42:19
832
原创 大模型学习课程-Datawhale-LLMCookbook-编写 Prompt 的原则(Deepseek API 替代方案)
本章的主要内容为编写 Prompt 的原则,在本章中,我们将给出两个编写 Prompt 的原则与一些相关的策略,您可以练习编写高效的 Prompt,从而便捷而有效地使用 LLM。。
2025-06-05 11:33:43
873
原创 HuggingFace - LLMCourse:微调一个掩码(mask)语言模型 (PyTorch)(#Windows #Jupyter Notebook)
【代码】HuggingFace - LLMCourse:微调一个掩码(mask)语言模型 (PyTorch)(#Windows #Jupyter Notebook)
2025-06-04 15:18:53
189
原创 HuggingFace - LLMCourse:基于已有的 tokenizer 训练新的 tokenizer(#Windows #Jupyter Notebook)
本文提供了在Windows系统下使用Jupyter Notebook训练新tokenizer的优化方案。主要内容包括:1) 安装必要库和配置Git环境;2) 加载code_search_net数据集并创建训练语料生成器;3) 基于GPT2的旧tokenizer训练新tokenizer;4) 对比新旧tokenizer的分词效果;5) 将新tokenizer保存到本地或推送到HuggingFace Hub。文中包含详细的代码实现和注意事项,特别针对Windows环境下的常见问题提供了解决方案,如数据集加载、内
2025-05-28 11:30:52
300
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人