- 博客(960)
- 收藏
- 关注
原创 PVE 配置显卡直通,打造本地大模型地基
本文将详细介绍如何在虚拟化平台 Proxmox Virtual Environment(PVE)配置显卡直通,将宿主机上的物理显卡直接分配给 AI 虚拟机使用。
2024-11-13 18:51:41
157
原创 大模型入门:Embedding模型概念、源码分析和使用示例
本篇对嵌入模型的概念、Spring AI 框架对支持嵌入模型的设计,并对其源码进行分析,最后对API接口进行使用。
2024-11-12 20:22:45
354
原创 《开源大模型食用指南》已发布,助你速通大模型!(附教程)
《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-11-12 09:51:12
444
原创 LLM大模型理论基础(so-large-lm)课程笔记!(附大模型资源)
本前言介绍的课程笔记源自于“大模型理论基础(so-large-lm)”课程, 一个致力于探索和理解大型模型发展的前沿课程。
2024-11-12 09:50:12
417
原创 从零开始:Windows系统下Qwen2.5大模型的实践教程(一)
本文将基于Windows系统和CPU环境,使用Qwen2.5系列模型,详细实践从大型语言模型的下载、部署到微调的全过程。
2024-11-10 11:41:51
859
原创 通过Jupyter Notebook+OpenAI+ollama简单的调用本地模型
通过Jupyter Notebook+OpenAI+ollama简单的调用本地模型
2024-11-07 18:07:51
849
原创 【大模型实战项目】基于大模型+知识图谱的知识库问答 (附项目)
今天给大家介绍一个git开源的宝藏项目 — 基于大模型+知识图谱的知识库问答,这里还搭配了一个演示dome给大家,如需要此项目练手的,我已经打包好了放在文末~
2024-11-06 11:06:13
968
原创 一文读懂什么是RAG,如何搭建多模态RAG降低大模型幻觉
大语言模型(LLM)能够执行各种自然语言任务,例如文本生成、语言翻译、文本摘要、问答等。然而,使用 LLM 的一个显著局限是 LLM 幻觉。
2024-11-06 09:55:28
650
原创 LLM大模型:图解RAG
RAG(Retrieval-Augmented Generation, 检索增强生成)是一种将信息检索与生成模型结合的方法,也是企业落地大模型应用最常见的方式。
2024-11-05 10:30:58
606
原创 本地知识库部署指南:FastGPT 与 Dify,轻松上手!
大家好,我是一名喜欢在家折腾本地部署的开发者,这次我来分享如何在本地运行 Ollama,并将它与 FastGPT 和 Dify 两个知识库对接。看起来复杂,但其实步骤并不难。我会尽量把内容讲得清楚易懂,加上一些幽默,让整个过程更有趣。
2024-11-04 11:09:20
971
原创 【大模型部署】本地源码方式部署启动MaxKB知识库问答系统,一篇文章搞定!
MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。
2024-11-04 11:06:36
1094
原创 本地部署 Llama 3.1:Ollama、OpenWeb UI 和 Spring AI 的综合指南
本文介绍如何使用 Ollama 在本地部署 Llama 3.1:8B 模型,并通过 OpenWeb UI 和 Spring AI 来增强模型交互体验和简化 API 的调用过程。
2024-10-31 14:54:49
774
原创 【大模型微调】llamafactory+ollama+docker 微调部署全流程速通(RTX4090公版)
【大模型微调】llamafactory+ollama+docker 微调部署全流程速通(RTX4090公版)
2024-10-29 19:58:33
593
原创 大模型落地应用:RAG快速落地-阿里云百炼
大模型在最近两年特别火,相信大家或多或少都听说过,那么大模型落地的应用场景,个人觉得RAG是现在能落地的应用场景之一
2024-10-29 11:14:28
908
原创 【RAG知识库】如何在LlamaIndex中使用RAG?
LlamaIndex 是一个数据框架,用于帮助基于 LLM 的应用程序摄取、构建结构和访问私有或特定领域的数据。
2024-10-28 15:24:49
779
原创 RAG实操教程: Langchain+Milvus向量数据库创建你的本地知识库
我们知道 LLM的知识库是通过现有的网络公开的数据作为数据源来训练的,现在公开的很多模型他们基于的训练数据会比我们现在网络上公开的数据早很多,那自然就会产生一种问题,网络上最新的数据和知识 LLM是不知道。
2024-10-28 14:22:24
1042
原创 【AI大模型】部署 4.8k star 的 Xinference 给知识库接入本地 Rerank 模型
Xorbits Inference (Xinference) 是一个开源平台,用于简化各种 AI 模型的运行和集成。借助 Xinference,我们可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理,并创建强大的 AI 应用。
2024-10-25 10:06:27
824
原创 AnythingLLM一键AI私有知识库! 支持多种大模型、RAG 和 AI Agents!
AnythingLLM是一个全栈AI应用程序,可以将任何文档、资源(如网址链接、音频、视频)输入大语言模型(LLM),与大模型互动。
2024-10-25 09:59:58
1073
原创 AI大模型这么火,今天手把手教大家从搭建环境开始实现本地部署ChatGLM2 6B 大模型
AI大模型这么火,今天手把手教大家从搭建环境开始实现本地部署ChatGLM2 6B 大模型
2024-10-21 14:36:58
702
原创 【AI大模型】LobeChat体验
LobeChat 是开源的高性能聊天机器人框架,支持语音合成、多模态、可扩展的(Function Call)插件系统。支持一键免费部署私人 ChatGPT/LLM 网页应用程序。
2024-10-18 10:38:37
1047
原创 为什么AI大模型连简单的加法都算不对?
这个问题引发了一个常见的现象,即大模型(如讯飞星火、Kimi等)在涉及简单的加法运算时,结果经常不准确。
2024-10-18 10:26:15
986
1
原创 简单易懂的LLM三角原则,让你轻松开发大模型应用
先前我们聊到了《从零开始构建大模型(LLM)应用》,不少朋友偷偷问我:“什么是LLM的三角原则?”今天就给大家仔细讲讲构建LLM应用的三角原则。这套原则其实不复杂,由“3+1”(一范式三原则)个基础组成,适合任何团队来实践。
2024-10-16 14:46:47
1236
原创 从理论到实践:哪些技术能有效提升 RAG 系统的可靠性?
在现有市场上,使用检索增强生成(Retrieval-Augmented Generation,简称RAG)的应用中,我们发现未经处理的“幻觉”问题仍然非常严重。为了解决这个问题,我在实际操作中对四个公开的RAG数据集进行了详细评估,使用了流行的幻觉检测工具进行测试。在这里,我主要用到了AUROC(即接收者操作特征曲线下的面积)和精确度/召回率这两种指标来衡量检测效果。
2024-10-16 14:42:02
784
原创 AI大模型实战落地-巨量实体关系映射
实体关系映射是目前AI落地非常成熟的应用场景,但是如何做到多、快、好、省,仍然需要一些技巧,这里文分享一下我的方案。
2024-10-15 15:13:59
758
原创 Milvus×Dify半小时轻松构建RAG系统
最近,检索增强生成(RAG)技术在AI界引起了广泛关注。作为一种将知识库与生成模型结合的新型架构,RAG大大提升了AI应用的实际表现。而在构建RAG系统时,Milvus作为业界领先的开源向量数据库,扮演着关键角色。本文将通过在Dify平台上使用Milvus,带领大家构建一个高效的RAG系统,探索向量数据库的实际应用场景。
2024-10-15 14:53:21
685
原创 23个大模型推理框架及量化技术总结:兼看大模型信息抽取框架EDC
我们来看两个工作,关于大模型量化方法的一些总结以及EDC:大模型用于信息抽取框架。会有一些收获。里面提到23个主流的大模型推理框架以及新的知识图谱构建流程,很有意思
2024-10-14 14:14:29
730
原创 【AI大模型新书】使用生成式人工智能和Python开始数据分析
加速你对数据分析的掌握,借助ChatGPT的强大功能。不论你是数据分析新手,还是想更快完成更多工作且更高效的专业人士,《使用生成式AI和Python入门数据分析》将帮助你简化和加速数据分析过程!这本书由两位世界级的数据科学家和一位经验丰富的风险经理撰写,专注于日常实际分析任务。
2024-10-14 14:12:58
697
原创 【AI大模型】一个友好、强大、开源的GraphRAG UI
GraphRAG-UI: 是一个用户友好的界面,用于GraphRAG,这是一个强大的工具,使用检索增强生成(RAG)方法来索引和查询大量文本数据。这个项目支持最新版本的 graphrag-0.3.3,旨在为 GraphRAG 提供方便的管理和交互方法,支持配置像 Ollama 这样的本地大型语言模型,使用户更容易利用。
2024-10-12 11:27:23
684
原创 【大模型书籍】24年一书通关LLM大模型,<大模型应用开发极简入门>蛇尾书来了
大家好,今天给大家推荐一本大模型应用开发入门书籍《大模型应用开发极简入门》,本书对很多AI概念做了讲解和说明!朋友们如果有需要 《》,👉CSDN大礼包(安全链接,放心点击)👈。
2024-10-12 10:40:23
1418
原创 吴恩达宣布Meta正式推出Multimodal Llama 3.2新课程
吴恩达宣布Meta正式推出Multimodal Llama 3.2新课程。仅需1小时,你就能用Meta“最新最强”开源模型 Llama 3.2 构建新的应用程序了。
2024-10-11 16:04:19
297
原创 RAG前沿之CoV-RAG验证链增强及面向PDF文档的多模态RAG方案简析
本文今天看了RAG的两个工作,一个是一个面向PDF文档的RAG方案,可以理解为混合多模态检索,另一个是关于RAG与类COT的结合进展CoV-RAG。其中针对特定问题所采用的应对方式,当工程论文来看。
2024-10-11 15:51:13
374
原创 【LLM大模型书】入门必读!从零开始大模型开发与微调+大模型黑书(附PDF)
【LLM大模型书】入门必读!从零开始大模型开发与微调+大模型黑书(附PDF)
2024-10-10 14:19:14
962
原创 京东大模型革命电商搜推技术:挑战、实践与未来趋势
在 AICon 全球人工智能大会上,InfoQ 邀请了京东技术总监翟周伟,基于对电商场景的深刻理解和洞察,从实际问题分析出发,结合京东搜推业务在大模型上的相关创新性实践来解决这些痛点问题,阐述他们在电商大模型的技术探索。本文为整个演讲的内容文稿,期望对你有所启发。
2024-10-10 14:15:02
1212
原创 大模型书籍丨赵鑫教授出书《大语言模型综述》,第一本中文大语言模型学习笔记!
今年4月中旬, 人大赵鑫教授出书了《大语言模型》一书, 作为第一本中文大语言模型教程, 立刻引起广泛关注, 该书内容偏综述性, 非常系统性地介绍了大语言模型的基本原理、核心技术和研究进展, 对于了解大语言模型的全貌会有非常好的帮助。
2024-10-08 14:25:23
406
原创 【LLM大模型】揭秘Langchain4j的Chat Memory功能!
【LLM大模型】揭秘Langchain4j的Chat Memory功能!
2024-10-07 14:50:41
949
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅