Llama 3 大模型开源了！盘点 4 个 GitHub 上令人惊艳的项目！

最新推荐文章于 2025-04-04 09:45:00 发布

小天才学习机打游戏

最新推荐文章于 2025-04-04 09:45:00 发布

阅读量1.7k

点赞数 13

文章标签： llama 开源 github AI大模型 AIGC

本文链接：https://blog.csdn.net/m0_59164520/article/details/138583701

版权

01.Llama 3 大模型开源了！

Llama 3 是 Meta 发布的最新大型语言模型，旨在让个人、创作者、研究人员和各种规模的企业能够负责任地试验、创新和扩展他们的想法。
相比于之前发布的开源模型， Llama 3 的特性是：

数据量：训练的数据是 Llama 2数据集的 7 倍多
能力增强：推理和代码能力增强
训练效率：比 Llama2 高 3 倍；
模型大小：提供从 8B 到 70B 参数的不同大小的预训练和指令调整的 Llama 3语言模型
下载和使用：提供了模型权重和分词器的下载指南，以及如何在本地运行模型的快速入门步骤
支持模型并行：不同大小的模型需要不同的模型并行（MP）值
许可证: 模型和权重对研究人员和商业实体开放，旨在促进发现和道德的AI进步

开源地址：https://github.com/meta-llama/llama3

在这里插入图片描述

02.知识库问答系统

MaxKB 是一个基于大型语言模型（LLM）的知识库问答系统，旨在成为企业的“最强大脑”，由开发者 1Panel-dev 开源，目前已经获得了 2.9k 的 Star。这个是该开源项目的特性：

开箱即用：支持上传文档和自动爬取在线文档，文本自动拆分和向量化，提供良好的智能问答交互体验。
无缝嵌入：可以快速嵌入到第三方业务系统中，无需编码。
多模型支持：支持多种主流的大型模型，包括本地私有模型和云服务模型。

开源地址：https://github.com/1Panel-dev/MaxKB

在这里插入图片描述

03.构建 AI 助手的框架

Phidata 是一个用于构建具有记忆、知识和工具的AI助手的框架，用来解决大型语言模型（LLM）上下文限制和无法执行操作的问题。他的工作原理如下：

记忆：通过数据库存储聊天历史，使LLM能够进行长期对话。
知识：通过向量数据库存储信息，为LLM提供上下文。
工具：使LLM能够执行如从API提取数据、发送电子邮件或查询数据库等操作。

开源地址：https://github.com/phidatahq/phidata

在这里插入图片描述

04 开源的 RAG 引擎

RAGFlow 是由开发者 infiniflow 开源，目前已经获得了 5.2K 的 Star。该项目是一个开源的 RAG（Retrieval-Augmented Generation，检索增强生成）引擎，基于深度文档理解，为不同规模的企业提供简化的 RAG 工作流程。

它由如下关键特性：

高质量输入输出: 从复杂格式的非结构化数据中进行深度文档理解并提取知识。
模板化分块: 提供智能且可解释的模板选项。
基于引用的引用: 减少幻觉，通过可视化的文本分块允许人工干预，快速查看关键引用和可追溯的引用来支持基于事实的答案。
异构数据源兼容性: 支持 Word、PPT、Excel、TXT、图像、扫描副本、结构化数据、网页等。
自动化 RAG 工作流: 提供为个人和大型企业量身定制的简化 RAG 编排，包括可配置的 LLM 和嵌入模型，多重召回与融合重排，以及与业务无缝集成的直观 API。

开源地址：https://github.com/infiniflow/ragflow

在这里插入图片描述

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述