自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 大模型学习课程-Datawhale-LLMCookbook-聊天机器人(Deepseek API 替代方案)

此处我们另外要求模型创建一个 JSON 摘要,方便我们发送给订单系统。因此我们需要在上下文的基础上追加另一个系统消息,作为另一条指示 (instruction)。我们说创建一个刚刚订单的 JSON 摘要,列出每个项目的价格,字段应包括 1)披萨,包括尺寸,2)配料列表,3)饮料列表,4)辅菜列表,包括尺寸,最后是总价格。此处也可以定义为用户消息,不一定是系统消息。请注意,这里我们使用了一个较低的温度,因为对于这些类型的任务,我们希望输出相对可预测。

2025-06-05 18:52:07 746

原创 大模型学习课程-Datawhale-LLMCookbook-文本扩展(Deepseek API 替代方案)

​​。

2025-06-05 17:41:25 591

原创 大模型学习课程-Datawhale-LLMCookbook-推断(Deepseek API 替代方案)

在这节课中,你将从产品评论和新闻文章中推断情感和主题。​​。

2025-06-05 16:42:19 832

原创 大模型学习课程-Datawhale-LLMCookbook-编写 Prompt 的原则(Deepseek API 替代方案)

本章的主要内容为编写 Prompt 的原则,在本章中,我们将给出两个编写 Prompt 的原则与一些相关的策略,您可以练习编写高效的 Prompt,从而便捷而有效地使用 LLM。​​。

2025-06-05 11:33:43 873

原创 HuggingFace - LLMCourse:微调一个掩码(mask)语言模型 (PyTorch)(#Windows #Jupyter Notebook)

【代码】HuggingFace - LLMCourse:微调一个掩码(mask)语言模型 (PyTorch)(#Windows #Jupyter Notebook)

2025-06-04 15:18:53 189

原创 HuggingFace - LLMCourse:基于已有的 tokenizer 训练新的 tokenizer(#Windows #Jupyter Notebook)

本文提供了在Windows系统下使用Jupyter Notebook训练新tokenizer的优化方案。主要内容包括:1) 安装必要库和配置Git环境;2) 加载code_search_net数据集并创建训练语料生成器;3) 基于GPT2的旧tokenizer训练新tokenizer;4) 对比新旧tokenizer的分词效果;5) 将新tokenizer保存到本地或推送到HuggingFace Hub。文中包含详细的代码实现和注意事项,特别针对Windows环境下的常见问题提供了解决方案,如数据集加载、内

2025-05-28 11:30:52 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除