大模型
文章平均质量分 94
easy2020
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用 LoRA 微调 Qwen3-0.6B 模型,打造专属宠物商店智能客服
以 Qwen3-0.6B 模型为基础,结合自制的宠物商店客服语料,通过 LoRA 轻量化微调技术,训练出一个能够回答常见宠物商店问题的智能客服模型。该实践展示了如何在低成本条件下快速打造垂直领域对话系统,为中小企业智能化应用提供了参考。原创 2025-09-26 16:57:03 · 2229 阅读 · 0 评论 -
从 BERT 到 GPT—— 基于 Transformer 架构的演变与能力分化
以Transformer架构为基础,深入解析了两大基于此架构的预训练模型——BERT与GPT的工作原理及其核心差异,探讨了Transformer架构在多模态处理等领域的技术延伸,展示了其灵活性和广泛的应用潜力。原创 2025-09-23 16:33:14 · 1937 阅读 · 0 评论
分享