- 博客(436)
- 收藏
- 关注
原创 LLM大模型入门这书必看:大语言模型 基础与前沿(附PDF书)
哈喽大家好!很久都没有更新大模型这块的书了,今天给大家说一下这本:《大语言模型:基础与前沿》,本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用,涵盖大语言模型的广泛主题,从基础到前沿,从方法到应用,涉及从方法论到应用场景方方面面的内容。
2024-11-23 16:48:24
722
原创 LLAMA3.1 8B 本地部署并配合Obsidian建立本地AI知识管理系统
目前,LLAMA3.1模型分为8B、70B、405B三个版本,其中70B和405B对于显存的要求均已超过了一般家用电脑的配置(或者换个说法,用一张4090也是带不起来的),所以运行8B即可。LLAMA3.1 8B的性能约相当于ChatGPT3.5。
2024-11-23 16:47:30
634
原创 复旦大学NLP教授出品:大规模语言模型·从理论到实践(附文档pdf)
复旦大学自然语言处理实验室张奇教授、桂韬研究员、郑锐博士生以及黄萱菁教授结合之前在自然语言处理领域研究经验,以及分布式系统和并行计算的教学经验,通过在大语言模型实践和理论研究的过程中,历时 8 个月完成本书《大规模语言模型·从理论到实践》不可错过!
2024-11-23 16:46:37
189
原创 权威震撼发布!真正意义上入门大模型必看的一本书,中国人工智能大模型技术白皮书!
近日,中国人工智能学会发布了《中国人工智能大模型技术白皮书》。白皮书全面梳理了大模型技术的发展历程、关键技术、生态发展、应用实践等方面的最新进展,并对其未来趋势做出展望。
2024-11-23 16:45:18
467
原创 复旦最新《大规模语言模型·从理论到实践》,LLM大模型中文新书发布,理论+代码
复旦大学自然语言处理实验室张奇教授、桂韬研究员、郑锐博士生以及黄萱菁教授结合之前在自然语言处理领域研究经验,以及分布式系统和并行计算的教学经验,通过在大语言模型实践和理论研究的过程中,历时 8 个月完成本书《大规模语言模型·从理论到实践》不可错过!《大规模语言模型·从理论到实践》旨在为对大语言模型感兴趣的读者提供一个入门指南,并可作为高年级本科生和研究生自然语言处理相关课程的大语言模型部分补充教材。鉴于大语言模型的研究仍在快速发展阶段,许多方面尚未达成完整结论或普遍共识。
2024-11-23 16:44:49
671
原创 全网爆火!仅需Python基础,即可从0构建LLM大语言模型(附PDF)
《从头开始构建大型语言模型》这本书,正是填补了这一知识的空白,成为了一本重量级且稀缺的资源。这本书,不仅是一本理论性的指南,更是一个实践性的教程。
2024-11-22 16:15:00
235
原创 22K star超强工具:Ollama,一条命令即可在本地跑 Llama2
今天我们推荐的是一条命令快速在本地运行大模型,在GitHub超过22K Star的开源项目:ollama。
2024-11-22 16:00:00
662
原创 赵宇教授大模型新书!《自然语言处理:大模型理论与实践》449页pdf!
《自然语言处理:大模型理论与实践》(预览版)一书以自然语言处理中语言模型为主线,涵盖了从基础理论到高级应用的全方位内容,逐步引导读者从基础的自然语言处理技术走向大模型的深度学习与实际应用。
2024-11-22 11:41:44
315
原创 AI大模型书籍丨掌握 LLM 和 RAG 技术,这本大模型小鸟书值得一看(附PDF)
本指南旨在帮助数据科学家、机器学习工程师和机器学习/AI 架构师探索信息检索与 LLMs 的集成及其相互增强。特别聚焦于 LLM 和检索增强生成(RAG)技术在信息检索中的应用,通过引入外部数据库与 LLMs 的结合,提高检索系统的性能。
2024-11-22 11:40:19
314
原创 大模型部署:手把手教你部署并使用国产开源大模型ChatGLM3-6B
本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。
2024-11-22 11:35:01
627
原创 构建医学文献智能助手:基于 LangChain 的专业领域 RAG 系统实践
在当今医疗科技快速发展的时代,每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文,从流行病学调查到药物研发数据,这些专业文献承载着推动医学进步的重要知识。
2024-11-21 19:00:00
684
原创 LangGraph进阶:构建ReACT架构的智能Agent
本文将深入探讨如何使用LangGraph来实现ReACT架构,并提供详细的代码示例和解释。
2024-11-21 18:45:00
964
原创 LangChain初学者指南:从零开始实现高效数据检索(3)
这个文档,我们将熟悉LangChain的向量存储和抽象检索器。支持从(向量)数据库和其他来源检索数据,并与大模型的工作流集成。
2024-11-21 14:20:34
830
原创 创建一个聊天机器人 | ️ LangChain(2)
我们了解了如何在LangChain中创建聊天机器人的基础知识。调用大语言模型,使用提示词模板和管理对话历史管理,一步一步地实现了一个可以记忆历史对话,支持流式输出的聊天机器人。
2024-11-21 14:16:55
613
原创 Ollama 本地CPU部署开源大模型
Ollama可以在本地CPU非常方便地部署许多开源的大模型。如 Facebook的llama3, 谷歌的gemma, 微软的phi3,阿里的qwen2 等模型。
2024-11-20 21:45:00
787
原创 RAG知识库:一文梳理RAG(检索增强生成)的现状与挑战
大模型相较于过去的语言模型具备更加强大的能力,但在实际应用中,例如在准确性、知识更新速度和答案透明度方面,仍存在不少问题,比如典型的幻觉现象。
2024-11-20 21:30:00
742
原创 100个大厂参与制作!中国信通院2024大模型典型示范应用案例集无敌了!
为充分体悟需求侧关切,中国信通院计划开展《开源人工智能大模型应用指南》编写前的系列筹备工作,通过调研、思路征集等形式收集业界在开源大模型应用过程中的“急难愁盼”及优秀经验,有效回应开源大模型治理关切,帮助企业“应用好、管理好”开源人工智能大模型。
2024-11-20 17:22:08
1014
原创 AI大模型本地部署:尝试用 Google Gemma 模型 MacOS 本地部署
最近 Google 发布了 Gemma,是 Gemini 的低配版本,既然是 Google 出品那我一定要来吃螃蟹的。所以我本地部署了一个 7b 的版本来尝试使用一下看看效果。
2024-11-20 17:19:30
816
原创 LIama 3+Mamba联手,推理速度提升1.6倍,比原始模型还要优异
把Llama 3蒸馏到Mamba,推理速度最高可提升1.6倍! 而且性能不减,甚至表现比原始模型还要优异。
2024-11-20 17:17:13
736
原创 【医疗AI大模型】大型语言模型疾病诊断综述
自动疾病诊断在临床实践中变得越来越有价值。大型语言模型(LLMs)的出现推动了人工智能领域的范式转变,越来越多的证据支持LLMs在诊断任务中的有效性。尽管该领域受到了越来越多的关注,但仍然缺乏整体视角。
2024-11-19 20:30:00
642
原创 大模型书籍丨AI Agent实战,Agent框架+7个实例助你拿捏Agent!
Agent 作为一种新兴的人工智能技术,正在受到越来越多的关注。要说清楚什么是 Agent,先得看看人工智能的本质是什么。
2024-11-19 16:23:03
1025
原创 李开复、周鸿祎推荐!《实战AI大模型》这本大模型书一定要读!
书中介绍了AI大模型的基础知识和关键技术,如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、PaLM和视觉模型等,并详细解释了这些模型的技术原理、实际应用以及高性能计算(HPC)技术的使用,如并行计算和内存优化。
2024-11-19 16:22:18
497
原创 工商银行金融科技研究院牵头,这份《大模型驱动的数字员工3.0建设应用白皮书》来了!
为更好推动数字金融高质量发展,助力“人工智能+”金融生态建设,工商银行金融科技研究院牵头,联合华为技术有限公司数字金融军团、北京金融科技产业联盟编撰了《发展新质生产力,开启数字金融新纪元——大模型驱动的数字员工3.0建设应用白皮书》。
2024-11-19 16:20:26
521
原创 基于OpenAI GPT API开发大模型应用:聊天API编程的方法
本系列文章介绍基于OpenAI GPT API开发大模型应用的方法,适合从零开始,也适合查缺补漏。
2024-11-19 16:18:12
960
原创 一文带你速通RAG、知识库和LLM!
检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言模型(LLM)的性能。
2024-11-18 16:45:00
985
原创 27K star无需配置!Langchain-Chatchat 快速基于LLM构建本地智能知识库(附教程)
今天我们分享一个开源项目,帮助你快速构建基于Langchain 和LLM 的本地知识库问答,在GitHub已经获得27K star,它就是:Langchain-Chatchat
2024-11-18 16:00:00
832
原创 大模型入门:程序员为什么要学习大模型应用开发?
人工智能大潮已来,不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样,基本上你见不到。你问任何一个人问他会不会用PPT,他都会说会用,只是说好还是不好。你除非说这个岗位跟电脑完全无关。但凡说能用上电脑的,基本上都会用excel和PPT,你不会用的基本上都被淘汰了,逻辑一样。
2024-11-18 15:45:00
1363
原创 Awesome-Chinese-LLM:开源中文大模型整理(附教程)
Awesome-Chinese-LLM 是整理开源的中文大语言模型,主要包括规模较小、可私有化部署、训练成本较低的模型,涵盖底座模型、垂直领域微调及应用、数据集与教程等。
2024-11-18 11:31:06
810
原创 知识库 RAG 修炼手册|一文讲透 RAG 背后的技术
今天我们继续剖析 RAG,将为大家详细介绍 RAG 背后的例如 Embedding、Transformer、BERT、LLM 等技术的发展历程和基本原理,以及它们是如何应用的。
2024-11-18 11:29:13
286
原创 大模型RAG知识库:对于LLM性能提升方面,RAG与Fine-Tune该如何选择?
正如我们所探讨的,在 RAG 和微调之间进行选择需要对 LLM 申请的独特需求和优先级进行细致的评估。没有一种万能的解决方案;成功在于使优化方法与任务的具体要求保持一致。通过评估关键标准(对外部数据的需求、调整模型行为、训练数据可用性、数据动态、结果透明度等),组织可以就最佳前进路径做出明智的决策。在某些情况下,同时利用 RAG 和微调的混合方法可能是最佳选择。
2024-11-16 14:40:23
724
原创 智谱 GLM-4-9B-Chat 模型认知微调,如何给大模型洗脑
本篇文章分享下智谱GLM-4-9B-Chat模型的安装与使用,同时展示了下认知微调后的效果。
2024-11-16 14:36:50
1025
原创 大模型基础教程:一图尽览大模型知识点!
近年来,人工智能技术在全球范围内取得了显著的成果,特别是在计算机视觉、自然语言处理、语音识别等领域。这些成果的取得离不开大规模预训练模型的支撑。
2024-11-16 14:35:36
1045
原创 医疗大模型微调:聊聊ChatGLM-6B医疗数据微调
参考了多个医疗大模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。
2024-11-15 10:42:16
326
原创 LLM大模型快速部署ChatGLM-6B大模型实战总结
作为这些产品的忠实测试者之一,我同时也尝试过这些产品的 API 接口,与微信对接,实现了微信聊天机器人。然而,当开源的大模型 ChatGLM 面世时,我却遇到了一些困扰,但幸运的是,腾讯云给了我一个难得的机会。
2024-11-15 10:40:12
614
原创 LLM大模型基础知识学习总结
在这个已经被AI大模型包围的时代,不了解一点大模型的基础知识和相关概念,可能出去聊天都接不上话。刚好近期我也一直在用GPT和GitHub Copilot,也刚好对这些基础知识很感兴趣,于是学习了一下,做了如下的整理总结,分享与你!
2024-11-15 10:38:35
306
原创 《开源大模型食用指南》已发布,助你速通大模型!(附教程)
《开源大模型食用指南》 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。
2024-11-15 10:33:52
941
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅