![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
各种LLM
文章平均质量分 94
Sunny_AI_addict
Hey, 一个AI爱好者以及内向者
在这里的博客主要基于自己学习到的内容,并以自己的方式简明地输出出来
展开
-
详解各种LLM系列|(6)Qwen技术内容详解(万字长文,超级详细!)
本文基于Qwen的技术报告,详解了Qwen从预训练到RLHF对齐的技术内容,并增加一些技术详解,力求cover全貌的过程中尽量地解释一些重要的细节原创 2024-08-07 13:27:38 · 870 阅读 · 0 评论 -
详解各种LLM系列|(5)LLaMA 3模型解析(Meta重磅发布!)
本文对近期发布的llama3进行技术详解原创 2024-06-17 14:04:46 · 1255 阅读 · 0 评论 -
详解各种LLM系列|(4)GLM(GPT国内最强开源平替)模型架构、预训练技术详解
本文就GLM的基础构架和预训练方式,深入浅出地分析GLM为何实现如此出众的效果。原创 2024-04-23 23:23:02 · 4898 阅读 · 0 评论 -
详解各种LLM系列|(3)Mistral-7B 技术内容详解
Mistral - 7B是怎么实现在各项数据集上的表现都超过Llama2 - 13B的原创 2024-01-10 12:46:56 · 2916 阅读 · 1 评论 -
详解各种LLM系列|(1)LLaMA 1 模型架构、预训练、部署优化特点总结
整理了LLaMA 1 模型架构、预训练、部署优化特点原创 2023-11-28 22:16:21 · 1129 阅读 · 0 评论 -
详解各种LLM系列|(2)LLaMA 2模型架构、 预训练、SFT内容详解 (PART-1)
LLaMA 2模型架构、 预训练、SFT内容详解原创 2023-12-02 12:35:01 · 3309 阅读 · 1 评论 -
详解各种LLM系列|(2)LLaMA 2模型架构、 预训练、SFT、RLHF内容详解(PART-2)
这一篇继续详细深入Llama 2的 RLHF内容,以及其实现的实验结果原创 2023-12-09 17:04:30 · 1693 阅读 · 0 评论