- 博客(295)
- 资源 (3)
- 收藏
- 关注
原创 AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一键部署
大语言模型推理服务框架—Ollama介绍了Ollama,Ollama以出色的设计一行命令完成推理框架部署,一行命令完成大模型部署,模型的下载不依赖梯子,速度非常快,大幅提升模型部署效率,同时,当有多卡GPU时,Ollama可以自动将模型分片到各个GPU上,博主使用V100显卡(单卡32G显存)部署llama3 70B(预计需要40G显存),自动完成了显存分配。
2024-09-18 11:15:00 437
原创 AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署
身处2024年,大模型技术从底层模型到AI应用都卷的要命,我们可以说是幸运的,也可以是幸福的,当然,学习的路上,不停的追赶,必定是疲惫的。分享一些丝滑的大模型技术栈内的项目,让大家疲惫并快乐着。
2024-09-17 10:15:00 579
原创 AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署
Dify内置了包含搜索引擎、天气预报、维基百科、SD等工具,同时自定义工具的配置化接入,团队成员一人接入,全组复用,高效!临下班了,本来只是想参加个话题活动,洋洋洒洒几千字。可能加入了太多感慨吧。本文首先结合自己的工作写了一些对Agent AI智能体的见解,接着介绍了Dify框架快捷部署的过程,最后阐述了Dify框架的特点。个人认为Dify的发展会让Agent AI智能体开发提效,涌现更多有趣有价值的AI应用。
2024-09-16 09:45:00 732 1
原创 AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效
由于近两年云原生热,大家对docker、docker compose及k8s或多或少都有一些涉猎,即便没有实际应用肯定也耳熟能详,今天对docker及docker compose的命令集进行梳理,大家可以收藏以便之后快速查阅。
2024-09-15 07:30:00 844
原创 LangChain: 大语言模型的新篇章
本文介绍了LangChain框架,它能够将大型语言模型与其他计算或知识来源相结合,从而实现功能更加强大的应用。接着,对LangChain的关键概念进行了详细说明,并基于该框架进行了一些案例尝试,旨在帮助读者更轻松地理解LangChain的工作原理。
2024-09-14 10:08:42 1258
原创 大模型书籍丨这本书太好了!150页就能让你上手大模型应用开发 (附PDF)
这是一本有关大模型应用开发的极简入门手册,为初学者提供了一份清晰、全面的“最小可用知识”,带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势,并在此基础上使用流行的 Python 编程语言构建大模型应用。
2024-09-12 15:27:07 824
原创 大模型书籍丨GitHub 开源大模型零基础入门教程:从头构建大语言模型 (附书籍)
知名人工智能研究员、畅销书《Python 机器学习》的作者 Sebastian Raschka 最近又写了一本新书 Build a Large Language Model from Scratch !
2024-09-12 15:18:20 675
原创 【大模型微调】LLaMA Factory微调Llama3模型
LLaMA Factory是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过Web UI界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架。
2024-09-09 14:46:16 792
原创 大模型书籍推荐 | 中国人民大学最新书籍《大语言模型》(附文档)
大语言模型LLM综述文章《A Survey of Large Language Models》已经更新到第13个版本。该综述系统梳理LLM的研究进展与核心技术,讨论了大量的相关工作。
2024-09-08 09:15:00 681
原创 大模型畅销书推荐!大模型应用开发-动手做AI Agent!踏上AI Agent开发之旅,掌握尖端技术和实用技巧
本次书单我为大家收集了大模型相关的新书。探索 《大模型应用开发 动手做AI Agent》 是畅销作者黄佳老师的新书,带领读者踏上AI Agent开发之旅,掌握尖端技术和实用技巧。
2024-09-07 08:30:00 517
原创 大模型时代,孩子还有必要学编程吗?
随着大模型技术的迅猛发展,AI逐渐渗透到我们生活的方方面面。“AI”“GPT”“大模型”等新兴的关键词也频繁出现在教育领域,占据了家长们的视线,也牵动着爸妈的“焦虑”神经。
2024-09-06 14:55:26 717
原创 程序员入门大模型,2024年值得关注的畅销书单!
在知乎上, "如何系统的入门大模型? "这一话题引爆了超过50万读者的热烈讨论。作为程序员,我们应当是最先了解大模型的人,也是率先成为了解大模型应用开发的人,到底如何入门大模型的应用开发?
2024-09-06 14:53:26 294
原创 探索 LLaMA3:Meta 最新的语言模型和应用前景
在近年来的人工智能领域中,大型语言模型(Large Language Model, LLM)逐渐成为热门话题。这些模型以其强大的语言理解和生成能力,在自然语言处理(NLP)领域中展现了巨大的潜力和应用价值
2024-09-05 21:14:08 987
原创 从 BERT 到 GPT:Transformer 模型在 AI 发展中的作用
Transformer 模型是自然语言处理(NLP)领域中的一种重要架构,由 Vaswani 等人在 2017 年提出,具有极大的影响力。
2024-09-05 21:11:58 893
原创 使用ollama + AnythingLLM快速且简单的在本地部署llama3
使用ollama + AnythingLLM快速且简单的在本地部署llama3
2024-09-04 15:30:04 878
原创 AI大模型实战篇:AI Agent设计模式,ReAct
随着人工智能技术的不断进步,AI Agent设计模式逐渐成为研究和应用的热点。ReAct模式作为AI Agent设计模式的起点,以其模拟人类思考和行动过程的特点,为各种智能应用提供了一种有效的实现途径。
2024-09-04 15:10:55 1149
原创 深度解析大模型领域:当下流行的人工智能大模型生成逻辑
在过去的几年里,人工智能领域经历了前所未有的革新,其中最引人注目的就是大规模预训练模型的崛起。这些模型,如GPT系列、BERT、T5、DALL·E和CLIP等,凭借其强大的语言理解和生成能力,已经在自然语言处理(NLP)、计算机视觉(CV)以及多模态理解等多个领域取得了显著成就。本文旨在深入探讨这些大模型的生成逻辑,揭示其背后的算法原理和技术挑战。
2024-09-02 16:00:22 1277
原创 大模型报告分享丨中国信通院重磅推荐《具身智能大模型发展报告(2024年)》发布,54页pdf
中国信息通信研究院、北京人形机器人创新中心有限公司联合发布了《具身智能发展报告(2024年)》报告。
2024-09-02 15:55:44 855
原创 芜湖起飞!6个LLM大模型必学的核心技术!
Transformer 是大模型的底层模型。在深度学习的早期阶段,循环神经网络(RNN)是处理序列数据的常用方法。尽管RNN及其变体在某些任务上表现良好,但它们在处理长序列时容易遇到梯度消失和模型退化问题。
2024-08-28 15:24:28 1107
原创 LLM大模型篇:大模型发展迈入爆发期,开启AI新纪元
大模型发展呈现“规模定律”,Transformer为技术基座。大模型(LLM)发展普遍呈现“规模定律”特征,即:模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系。
2024-08-26 15:56:19 959
原创 【LLM大模型】《自动驾驶中的多智能体强化学习》综述
强化学习(RL)是一种强大的序列决策工具,在许多具有挑战性的现实任务中取得了超越人类能力的表现。
2024-08-26 15:23:13 1264
原创 LLaMA3:开源战胜闭源意味着什么?
LLaMA3-405B的模型效果已经赶上目前最好的闭源模型GPT-4o和Claude-3.5,这可能是未来大模型开源与闭源的拐点,这里就LLaMA3的模型结构、训练过程与未来影响等方面说说我的看法。
2024-08-22 20:46:06 922
原创 【AI大模型】使用 SiliconCloud,免费使用最强开源大模型 Llama3.1-405b
当国内还有人说开源是智商税的时候,Meta 什么都没说,只是发布了开源标杆 Llama3.1。三种不同参数规模,8b,70b,405b。
2024-08-22 20:42:54 778
原创 【LLM大模型】Llama3.1 部署本地知识库应用
支持市面上主流的开源 LLM、 Embedding 模型与向量数据库,可实现全部使用开源模型离线私有部署。与此同时,该项目也支持 OpenAI GPT API 的调用。
2024-08-18 09:45:00 729
原创 【LLM大模型】首个超越GPT-4o的开源模型:LLAMA3.1开源了
今年4月份的时候,META发布了自己的第三代开源模型LLAMA3,并且在那次就说了LLAMA3目前还在训练当中。
2024-08-17 08:45:00 1014
原创 LLM大模型:Langchain--如何使用大模型 2.0
我们除了可以使用Langchain进行模型对话、提示词创作、嵌入模型,还可以使用其他的组件对大模型封装使用,打造我们自己的大模型。
2024-08-16 11:48:20 734
原创 【LLM大模型】AI Agent 终结者 LangGraph!
LangGraph是一个用于构建具有状态、多参与者应用程序的大语言模型(LLM)的库,用于创建智能体和多智能体的工作流程。
2024-08-16 11:09:03 333
原创 最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
根据最新的AI行业资讯,腾讯的混元大模型在多模态能力上取得了显著的进步,甚至在某些方面超越了国际上知名的模型如GPT-4、Claude-3.5和Gemini-1.5。
2024-08-15 16:29:46 948
原创 本地通过python运行AI大语言模型LLaMa2
Llama 全称 large language model, Meta AI 公司2023年发布的开源AI大型语言模型,参数7B~65B。最新版本为Llama 3。
2024-08-15 16:22:41 1038
原创 吴恩达:四个步骤,让大模型变得更好
著名人工智能学者、斯坦福大学教授吴恩达高度总结了提升生成式 AI 模型能力的方式,主要包括:1)提升模型的推理能力;2)扩展上下文窗口,并撰写一篇博客阐述了一套通用且高效的 prompt 策略。
2024-08-14 15:01:27 812
原创 《Python 机器学习》作者带着最新的LLM大模型书来了!
机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka** 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。
2024-08-14 14:59:11 776
原创 AI Agent 终结者 LangGraph!
LangGraph是一个用于构建具有状态、多参与者应用程序的大语言模型(LLM)的库,用于创建智能体和多智能体的工作流程。
2024-08-13 20:06:42 899
原创 【LLM大模型】RAG工程实践拦路虎之一:PDF格式解析杂谈
不管是Java还是Python里面,对于处理PDF中间件的部分,都需要对图形类的API/算法熟悉和掌握,这里面包含图形的转换、缩放、矩阵坐标、截取等等,都会在PDF提取的过程中使用到。在上面Python和Java生态库的开源组件,基本都是针对文字的PDF处理为主,当我们的PDF是扫描件时,那上面的组件统统失效,都提取不出来文本信息。:在处理PDF中,结合开源的技术中间件,对于PDF的ISO标准,我们也是需要了解的,这样更加有利于开发人员理解中间件的代码写法及含义。
2024-08-12 19:58:41 721
原创 【LLM大模型】实战0-1,Java开发者也能看懂的大模型应用开发实践!
大模型应用系统其实在目前阶段,可能应用最广的还是RAG领域,因此,本文也是通过在RAG领域的基础架构下,来实现应用的开发,主要需求点:让大模型理解文本(知识库)内容,基于知识库范围内的内容进行回答对话
2024-08-12 19:52:17 646
原创 大模型书籍推荐丨真正意义上入门大模型必看的一本书,中国人工智能大模型技术白皮书!(附文档)
近日,中国人工智能学会发布了《中国人工智能大模型技术白皮书》。白皮书全面梳理了大模型技术的发展历程、关键技术、生态发展、应用实践等方面的最新进展,并对其未来趋势做出展望。
2024-08-10 09:42:51 966
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人