
大语言模型
文章平均质量分 95
大语言模型入门教程+5篇大语言模型项目实战+大语言模型本地部署
西瓜WiFi
某厂大语言模型数据分析模块微调PM
分享大语言模型前沿动态
普及大语言模型知识
展开
-
【大语言模型LLM】- AI工具收录集合,一篇就够了!
大语言模型乐园,国内外大模型集合,持续更新...原创 2024-04-22 10:00:00 · 2500 阅读 · 0 评论 -
【大语言模型LLM】-基于大语言模型搭建客服助手(2)
基于大语言模型搭建客服助手原创 2024-05-03 22:58:29 · 1589 阅读 · 0 评论 -
【大语言模型LLM】-基于ChatGPT搭建客服助手(1)
【大语言模型LLM】-搭建基于 ChatGPT 的客服助手(1)原创 2024-04-30 17:20:55 · 1885 阅读 · 1 评论 -
【大语言模型LLM】-基础语言模型和指令微调的语言模型
到目前为止对 LLM 的描述中,我们将其描述为一次预测一个单词,但实际上还有一个更重要的技术细节。即 LLM 实际上并不是重复预测下一个单词,而是重复预测下一个 token。对于一个句子,语言模型会先使用分词器将其拆分为一个个 token ,而不是原始的单词。对于生僻词,可能会拆分为多个 token。这样可以大幅降低字典规模,提高模型训练和推断的效率。例如,对于 “Learning new things is fun!原创 2024-04-24 15:20:49 · 2043 阅读 · 0 评论 -
【大语言模型LLM】-大语言模型如何编写Prompt?
在实际的工作流中,我们往往要处理大量的评论文本,下面的示例将多条用户评价集合在一个列表中,并利用 for 循环和文本概括(Summarize)提示词,将评价概括至小于 20 个词以下,并按顺序打印。虽然我们通过添加关键角度侧重的 Prompt ,确实让文本摘要更侧重于某一特定方面,然而,我们可以发现,在结果中也会保留一些其他信息,比如偏重价格与质量角度的概括中仍保留了“快递提前到货”的信息。在这个例子中,学生的答案是错误的,但如果我们没有先让模型自己计算,那么可能会被误导以为学生是正确的。原创 2024-04-18 13:34:55 · 4539 阅读 · 2 评论 -
【大语言模型LLM】-使用大语言模型搭建点餐机器人
此处我们另外要求模型创建一个 JSON 摘要,方便我们发送给订单系统。因此我们需要在上下文的基础上追加另一个系统消息,作为另一条指示 (instruction)。披萨,包括尺寸配料列表饮料列表辅菜列表,包括尺寸,总价格。此处也可以定义为用户消息,不一定是系统消息。请注意,这里我们使用了一个较低的温度,因为对于这些类型的任务,我们希望输出相对可预测。'''创建上一个食品订单的 json 摘要。原创 2024-04-21 18:35:57 · 1679 阅读 · 0 评论 -
【大语言模型LLM】-如何使用大语言模型提高工作效率?
接上一章,这一节我们开始学习大语言模型的常见使用场景,对于我们普通人而言,大语言模型的基础使用场景有哪些?如何使用大语言模型提高工作效率,这一章,我们来介绍大语言模型的常见使用场景,相关环境配置见上一章。原创 2024-04-21 17:34:52 · 2626 阅读 · 0 评论