自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(347)
  • 收藏
  • 关注

原创 【大模型部署】本地部署开源大模型的完整教程:LangChain + Streamlit+ Llama

在过去的几个月里,大型语言模型(llm)获得了极大的关注,这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员。

2024-10-03 11:45:00 653

原创 2024年大语言模型的微调

一个LLM的生命周期包含多个步骤,下面将讨论这个周期中最活跃、最密集的部分之一 -- fine-tuning(微调)过程。

2024-10-02 10:45:00 630

原创 向量数据库与LLM的集成:实践指南

本文将了解到什么是向量数据库,以及如何与LLMs进行集成。通过LLMs和向量数据库的结合,可以节省微调带来的开销和时间。

2024-10-01 09:45:00 771

原创 Mac下使用Docker快速布署FastGPT实现AI私有知识库

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景!

2024-09-29 19:57:15 851

原创 终于!GLM-4-9B 支持 Ollama 部署

GLM-4-9B 及 CodeGeeX4-ALL-9B 现已支持Ollama**部署。GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。

2024-09-27 20:32:38 1031

原创 大模型——如何本地跑通一个大模型

大模型——如何本地跑通一个大模型

2024-09-24 15:34:26 376

原创 舒服了!学大模型必看的学习书籍来了

最近整理了日前市面上一大波大模型的书,已经打包成pdf了,大家有需要的,可以自行添加获取,纯福利,无套路,添加后说明是哪本书,会直接给大家!

2024-09-24 14:32:23 113

原创 大模型Agent的核心是prompt吗?

大模型Agent的核心不仅仅是prompt,但prompt确实是目前实现Agent的重要手段之一。要理解这一点,我们先得澄清什么是AI Agent。

2024-09-19 20:41:24 991

原创 现在市场上有哪些大模型?什么样的大模型适合国内企业?

从23年ChatGPT爆火以来,国内各大厂商也争先入局,国内大模型发展也经历了“百模大战”,截止最新已经发展到了180多个大模型,在大模型发展上,国内正在奋起直追,国内外第一梯队大模型在中文领域的通用能力差距在持续缩小。

2024-09-19 20:38:08 947

原创 LLM大模型实战 —— DB-GPT阿里云部署指南

DB-GPT 是一个实验性的开源应用,它基于FastChat,并使用vicuna-13b作为基础模型, 模型与数据全部本地化部署, 绝对保障数据的隐私安全。 同时此GPT项目可以直接本地部署连接到私有数据库, 进行私有数据处理, 目前已支持SQL生成、SQL诊断、数据库知识问答、数据处理等一系列的工作。

2024-09-17 11:15:00 965

原创 如何在 TensorRT-LLM 中支持 Qwen 模型

大型语言模型正以其惊人的新能力推动人工智能的发展,扩大其应用范围。然而,由于这类模型具有庞大的参数规模,部署和推理的难度和成本极高,这一挑战一直困扰着 AI 领域。

2024-09-16 09:45:00 728

原创 关于 LLM 和图数据库、知识图谱的那些事

RAG 在用户提交相关任务时,会将提问的问题进行解析,搭配已有的额外知识库,找寻到同它相关的那些知识。

2024-09-15 09:45:00 721

原创 盘点开源大语言模型LLMs

有meta在前,开源社区对GPT也做出的很多优秀的工作,目的就是用更小的参数量来逼近chatGPT的效果,同时更友好的部署。

2024-09-14 14:21:57 968

原创 大模型行业报告丨中国人工智能协会发布:中国人工智能大模型技术白皮书!

近期,中国人工智能协会发布了《中国人工智能大模型技术白皮书》,涵盖了大模型发展历程、关键技术、困难及挑战以及未来发展的展望。

2024-09-12 20:39:56 1337

原创 5分钟打造基于 LangChain+Gradio 的个人知识助理

今天和大家分享一些如何在5分钟之内利用 LangChain+Gradio 搭建一个自己的个人知识助理。这听起来就很酷,我们不需要依赖其他第三方提供的服务,也可以保证自己数据的安全性,赶紧顺着本文往下看吧。

2024-09-12 20:30:54 876

原创 为什么RAG对下一代AI开发至关重要

RAG(检索增强生成)是一种突破性技术,它将信息检索与文本生成相结合,以提高人工智能系统的知识和准确性。利用 RAG 可以帮助开发人员确保应用程序响应具有最丰富的上下文和准确性,因为它可以访问原始模型训练之外的精选数据库。这种能力使 RAG 尤其受欢迎,尤其是在聊天机器人、虚拟助手和内容生成器中。

2024-09-09 15:51:16 914

原创 小白入门LLM大模型最牛X教程------上交《动手学大模型应用开发》!

本项目是一个面向小白开发者的大模型应用开发教程,旨在结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,涵盖了大模型应用开发的方方面面

2024-09-05 22:07:25 803

原创 大模型实战:构建知识图谱:从技术到实战的完整指南

本文深入探讨了知识图谱的构建全流程,涵盖了基础理论、数据获取与预处理、知识表示方法、知识图谱构建技术等关键环节。

2024-09-04 15:51:20 1516

原创 大语言模型:为什么说RAG是AI 2.0时代的“杀手级”应用?

随着人工智能技术的不断演进,我们正处在一个由AI 1.0向AI 2.0转型的关键节点。AI 1.0时代,人工智能的应用主要集中在规则驱动的系统和基于大数据的模式识别上。尽管这些技术在各个领域取得了显著进展,但它们在应对复杂任务、处理长尾问题和实现真正的智能交互方面仍然存在局限。

2024-09-04 15:48:46 1164

原创 大模型开源教程:LLM开源大模型食用指南:self-llm(附文档)

本项目的学习建议是,先学习环境配置,然后再学习模型的配置使用,最后再学习扭矩。因为环境配置是基础,模型的配置使用是基础,扭矩是进阶。初学者可以选择Qwen1.5,InternLM2,MiniCPM等模型优先学习。

2024-09-02 17:37:25 979

原创 LLM的训练微调:LLaMA-Factory,Git必学大模型微调实战模型

LLaMA-Factory是一个整合了主流的各种高效训练微调技术、适配主流开源模型、功能丰富、适配性好的训练框架。

2024-09-02 17:31:41 951

原创 LLM大模型入门天花板!《大模型入门:技术原理与实战应用》一本书让你轻松入门大模型(附PDF)

随着大模型技术的不断完善和普及,我们将进入一个由数据驱动、智能辅助的全新工作模式和生活模式。个人和企业将能够利用大模型来降本增效,并创造全新的用户体验。

2024-08-29 16:02:27 755

原创 好书推荐丨学NLP不看这本书等于白学!一书弄懂NLP自然语言处理(附文档)

随着人工智能技术的飞速发展,自然语言处理成为了计算机科学与人工智能领域中不可或缺的关键技术之一。作为一名长期致力于人工智能和自然语言处理研究的学者,今天给大家推荐的这本《自然语言处理:大模型理论与实践》正是学NLP自然语言非常牛逼的一本书!

2024-08-28 17:03:22 608

原创 Llama 3.1 405B:4050亿参数史上最强开源大模型

Meta公司推出了其最大的开源人工智能模型——Llama 3.1 405B,拥有4050亿个参数,与GPT-4o和Claude 3.5 Sonnet相媲美。

2024-08-28 16:47:54 972

原创 大规模语言模型在分布式基础设施上的高效训练:综述

本综述探讨了LLM训练系统的最新进展,包括在训练基础设施中使用AI加速器、网络、存储和调度的创新。

2024-08-26 16:27:28 992

原创 《Llama 3大模型》技术报告中英文版,95页pdf

现代人工智能(AI)系统由基础模型驱动。本文介绍了一套新的基础模型,称为Llama 3。它是一群本地支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个具有4050亿参数和高达128K令牌上下文窗口的密集Transformer。

2024-08-26 16:25:01 894

原创 一文读懂LLM Fine Tuning(微调)【大模型行业应用入门系列】

LLM(大型语言模型)微调是一种定制化技术,广泛应用于将通用预训练模型转化为满足特定任务或领域需求的专用模型。

2024-08-23 17:52:59 673

原创 一文讲明白初学者怎么入门大语言模型(LLM)?

关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。

2024-08-23 17:49:46 986

原创 从零开始构建大模型!《Python 机器学习》作者新书来了!

近期,机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。

2024-08-22 21:34:24 1262

原创 【LLM大模型】本地玩转多模态Llama3

一般开源的LLM,例如Llama3和Qwen2等,只支持文本的输入,只能理解文本的内容,实现基于文本的逻辑推理和意图识别。

2024-08-22 21:31:21 712

原创 LLM 各种技巧| Prompt Engineering 大总结|指南一

LLM 各种技巧| Prompt Engineering 大总结|指南一

2024-08-20 17:48:24 1018

原创 【无标题】LLM 各种技巧| Prompt Engineering 大总结|指南二

篇主要是要介绍在各种不同情境下,LLM 的各种Prompt Engineering 技巧,每篇都有附上论文连结与架构图,方便你快速检阅,希望能助帮你深入了解Prompt Engineering 领域的最新进展及其发展趋势。

2024-08-20 17:46:11 585

原创 【RAG入门教程】Langchian框架 v0.2介绍

LangChain 是一个开源框架,旨在简化使用大型语言模型 (LLM) 创建应用程序的过程。可以将其想象成一套使用高级语言工具进行搭建的乐高积木。

2024-08-18 07:45:00 1559

原创 【RAG入门教程】Langchian的Embedding介绍与使用

词向量是 NLP 中的一种表示形式,其中词汇表中的单词或短语被映射到实数向量。它们用于捕获高维空间中单词之间的语义和句法相似性。

2024-08-17 09:00:00 2054

原创 【RAG入门教程】Langchian的文档切分

在 Langchain 中,文档转换器是一种在将文档提供给其他 Langchain 组件之前对其进行处理的工具。通过清理、处理和转换文档,这些工具可确保 LLM 和其他 Langchain 组件以优化其性能的格式接收数据。

2024-08-16 16:51:04 601

原创 【RAG入门教程】Langchian框架-Vector Stores

向量存储旨在高效处理大量向量,提供根据特定标准添加、查询和检索向量的功能。它可用于支持语义搜索等应用程序,在这些应用程序中,您可以查找与给定查询在语义上相似的文本段落或文档。

2024-08-16 16:48:31 621

原创 【LLM大模型】LlamaIndex 安装与配置(不含OpenAI)

【LLM大模型】LlamaIndex 安装与配置(不含OpenAI)

2024-08-15 16:55:27 998

原创 LLM大模型:LlamaIndex 起步教程(本地模型)

LLM大模型:LlamaIndex 起步教程(本地模型)

2024-08-15 16:53:17 935

原创 医疗大模型,巨头们的新赛场

说起近两年最热门的话题,那一定非大模型莫属了。众所周知,伴随着ChatGPT的强势出圈,全球范围内掀起了一波人工智能热潮,国内外的诸多企业都开足马力,推出了自己的大模型产品。而AI大模型产品的不断问世,也上演了一番“百模大战”的盛况。

2024-08-13 20:55:05 770

原创 【LLM】医疗大语言模型:CareGPT

CareGPT (关怀GPT)是一个医疗大语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。

2024-08-13 20:53:43 968

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除