自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(302)
  • 资源 (3)
  • 收藏
  • 关注

原创 《Python 机器学习》作者带着最新的LLM大模型书来了!

机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka** 又写了一本新书 ——《Build a Large Language Model (From Scratch)》,旨在讲解从头开始构建大型语言模型的整个过程,包括如何创建、训练和调整大型语言模型。

2024-08-14 14:59:11 779

原创 LLM 大语言模型的现状:沿着S型曲线发展

人工智能社区正在拥抱S型曲线——在最初的快速增长之后,随着我们遇到自然限制,进展开始趋于平缓。

2024-08-13 20:08:24 656

原创 AI Agent 终结者 LangGraph!

LangGraph是一个用于构建具有状态、多参与者应用程序的大语言模型(LLM)的库,用于创建智能体和多智能体的工作流程。

2024-08-13 20:06:42 904

原创 【LLM大模型】RAG工程实践拦路虎之一:PDF格式解析杂谈

不管是Java还是Python里面,对于处理PDF中间件的部分,都需要对图形类的API/算法熟悉和掌握,这里面包含图形的转换、缩放、矩阵坐标、截取等等,都会在PDF提取的过程中使用到。在上面Python和Java生态库的开源组件,基本都是针对文字的PDF处理为主,当我们的PDF是扫描件时,那上面的组件统统失效,都提取不出来文本信息。:在处理PDF中,结合开源的技术中间件,对于PDF的ISO标准,我们也是需要了解的,这样更加有利于开发人员理解中间件的代码写法及含义。

2024-08-12 19:58:41 728

原创 【LLM大模型】实战0-1,Java开发者也能看懂的大模型应用开发实践!

大模型应用系统其实在目前阶段,可能应用最广的还是RAG领域,因此,本文也是通过在RAG领域的基础架构下,来实现应用的开发,主要需求点:让大模型理解文本(知识库)内容,基于知识库范围内的内容进行回答对话

2024-08-12 19:52:17 653

原创 大模型书籍推荐丨真正意义上入门大模型必看的一本书,中国人工智能大模型技术白皮书!(附文档)

近日,中国人工智能学会发布了《中国人工智能大模型技术白皮书》。白皮书全面梳理了大模型技术的发展历程、关键技术、生态发展、应用实践等方面的最新进展,并对其未来趋势做出展望。

2024-08-10 09:42:51 973

原创 过去式就能越狱大模型?一文了解大模型安全攻防战!

过去式就能越狱大模型?一文了解大模型安全攻防战!

2024-08-10 09:40:54 804

原创 【LLM大模型】RAG技术要点及英智未来的应用实践

RAG是检索增强生成(Retrieval-augmented Generation),概念是在2020年发表的论文《面向知识密集型NLP任务的检索增强生成》中提出的。

2024-08-09 16:04:13 738

原创 去年爆火的大模型综述,如今中国人民大学直接出书了

相信很多朋友都看过这篇论文,在 2023 年 3 月,一支来自中国人民大学的团队,发表了一篇大模型综述《A Survey of Large Language Models》

2024-08-08 16:49:25 1085

原创 书籍推荐:最新入门大模型书丨大模型应用开发极简入门

AI 领域的进展日新月异,新资料一波接一波。这本《大模型应用开发极简入门:基于 GPT-4 和 ChatGPT》,很适合想了解大模型应用开发的朋友阅读,特别是准备入门大模型应用开发的程序员,原作是在 2023 年完成的,但译者很给力,把信息批注更新到了 2023 年 12 月。

2024-08-08 16:44:05 766

原创 LLM开源大模型食用指南:self-llm

self-llm 是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。

2024-08-07 21:36:01 567

原创 【AI大模型】LLM Agent之从经验中不断学习的智能体

Agent智能体的工作流可以简单分成两种:一种是固定的静态工作流,一种是智能体自主决策的动态工作流。

2024-08-06 16:13:50 748

原创 【AI大模型】LLM之图表理解任务-多模态篇

这一章我们聚焦多模态图表数据。先讨论下单纯使用prompt的情况下,图片和文字模态哪种表格模型理解的效果更好更好,再说下和表格相关的图表理解任务的微调方案。

2024-08-06 16:09:40 805

原创 【LLM大模型】大模型Infra这些年,从黑铁时代到黄金时代再到白银时代

越来越多人开始关注大模型,很多做工程开发的同学问我怎么入门大模型训练推理系统软件(俗称大模型Infra)

2024-08-05 15:15:34 1079

原创 LLM大模型中,温度系数(temperature)的PyTorch和TensorFlow框架

在大模型中,温度系数(temperature)通常用于调整模型的输出概率分布。温度系数的概念来源于物理学的热力学,它可以理解为一个“热度”值,用于控制模型的输出稀疏程度。

2024-08-05 15:13:58 636

原创 【LLM大模型】内行人都在学的大模型黑书,外网爆火的LLM应用手册来了!

Transformer正在颠覆AI领域。而这本大模型黑书《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》分步展示如何微调GPT-3等预训练模型。

2024-08-02 20:11:09 483

原创 超级重磅!《大语言模型综述》新书出炉,中国人民大学出版,391页pdf(附文档)

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900余篇参考文献。

2024-08-02 19:24:07 848

原创 开源一个RAG大模型本地知识库问答机器人-ChatWiki

目前大模型非常火爆,很多企业一直想把大模型用在企业的客服中,但是基本上没有太多的成功案例。

2024-08-01 10:19:50 779

原创 【LLM大模型】RAG流程优化(微调)的4个基本策略

我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。

2024-08-01 10:14:36 814

原创 【LLM大模型】Llama 3 8B模型微调实战

大多数人工智能领域的工具都会使用到Python,这个需要提前安装,同时推荐使用虚拟环境进行环境的隔离,比如用Anaconda(conda create -n xxx )或者使用Python自带的模块创建虚拟环境(python -m venv xxx)。同时在使用前请记得激活环境。

2024-07-31 15:08:40 609

原创 【LLM大模型】使用Ollama本地部署Llama 3.1大模型

前几天,Meta发布了他们迄今为止体量最大的开源AI模型——Llama 3.1。这个模型在多项基准测试中表现卓越,甚至优于GPT-4o和Anthropic的Claude 3.5 Sonnet。

2024-07-31 15:02:32 837

原创 LLM大模型:RAG 向量数据库

LLM大模型:RAG 向量数据库

2024-07-30 16:09:58 347

原创 【LLM大模型】prompt 工程(Prompt Engineering)

Prompt(提示词)是一个 指令 、问题或者语句,能被用来引导或指示一个语言模型生成特定的文本输出。Prompt是用户与语言模型交互的起始点,它告诉模型用户的意图,并且期望模型能以有意义且相关的方式回应。

2024-07-30 16:03:47 1580

原创 【LLM大模型】构建本地知识库(下):使用RAG构建知识库

在上一篇文章中,我们已经尝试在本地部署了大模型以及利用langchain框架来构建起基于大模型的应用程序。在本章中,我们将更近一步,在现有的应用程序上尝试利用RAG来继续强化应用。

2024-07-29 10:26:00 1243

原创 【LLM大模型】构建本地知识库(上): langchain+ollama构建本地大模型应用

【LLM大模型】构建本地知识库(上): langchain+ollama构建本地大模型应用

2024-07-29 10:23:15 1605

原创 中国信通院:《2024大模型典型示范应用案例集》正式发布,企业落地大模型必看(附文档)

自《2024大型模型典型示范应用案例集》于四月启动征集以来,社会各界给予了极高的关注。中国信通院收到了来自各界的数百份申报案例。

2024-07-27 15:25:57 582

原创 从零学习大模型——使用GLM-4-9B + BGE-M3 + langchain + chroma建立的本地RAG应用(一)——环境准备

由于GLM4在2024/7/16发布了新的更新,所以在这之后下载到本地的模型在依赖搭建时需要依照新版本的规定进行安装

2024-07-22 10:40:27 1223

原创 从零学习大模型——使用GLM-4-9B-Chat + BGE-M3 + langchain + chroma建立的本地RAG应用

第一篇介绍了如何配置最基本的环境并下载了GLM-4-9B-Chat到本地,接下来我们试着将GLM-4-9B-Chat接入LangChain。

2024-07-22 10:38:39 815

原创 做LLM推理时,常见的显卡如何选择?

随着开源LLM越来越成熟,业务接入LLM推理也成为必然,如何选模型大小和显卡,主要看下面这些。

2024-07-21 08:15:00 1077

原创 使用LangChain与ChatGLM实现本地知识库(一)

本篇主要内容为介绍ChatGLM3的安装使用,后续才会涉及到使用LangChain实现本地知识库的内容;ChatGLM为智谱与清华大学开源的一个大语言模型,支持多轮对话、内容创作等,ChatGLM3-6B为ChatGLM3系列中门槛相对较低的一个,本地部署提供兼容OpenAI的API;LangChain用于快速开发基于大语言模型应用程序的框架,提供了一整套工具、组件、接口等使得程序与大语言模型轻松交互组件快速组合、集成;如在模型上外挂本地知识库等;

2024-07-20 09:45:00 1055

原创 LangChain原理学习笔记(大模型)

最新越发觉得AI的发展,对未来是一场革命,LangChain已经在工程设计上有了最佳实践,类似于AI时代的编程模型或编程框架,有点Spring框架的意思。之前在LangChain上也有些最佳实践,所以在这里分享记录下。

2024-07-19 15:35:05 912

原创 LangChain轻松入门和开发实践

LangChain能够简化开发与语言模型工作流中的复杂部分,帮助开发人员能够更轻松地进行开发,并定制满足需求的应用。

2024-07-19 15:32:50 415

原创 程序员为什么要学习LLM大模型应用开发?

人工智能大潮已来,不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样,基本上你见不到。你问任何一个人问他会不会用PPT,他都会说会用,只是说好还是不好。你除非说这个岗位跟电脑完全无关。但凡说能用上电脑的,基本上都会用excel和PPT,你不会用的基本上都被淘汰了,逻辑一样。

2024-07-18 16:41:10 920

原创 大模型初学解惑:大模型技术的发展与实践

大语言模型是一种深度学习模型,特别是属于自然语言处理(NLP)的领域,一般是指包含数干亿(或更多)参数的语言模型,这些参数是在大量文本数据上训练的,例如模型GPT-3,PaLM,LLaMA等,大语言模型的目的是理解和生成自然语言,通过学习大量的文本数据来预测下一个词或生成与给定文本相关的内容。

2024-07-18 16:40:02 893

原创 LLM大模型:3分钟教你搞懂人工智能大模型的训练过程

3分钟教你搞懂人工智能大模型的训练过程

2024-07-18 16:39:12 621

原创 LLM大模型:《GLM-4 大模型部署微调教程》发布!

智谱 AI 发布了最新开源模型 GLM4,通过 10T 高质量多语言数据与更先进的训练技术,达到了更加出色的生成效果。

2024-07-17 10:43:00 486

原创 AI产品经理的入门转型路线图

在广义上是指任何能够让计算机通过图灵测试的方法和系统,而狭义上则是指通过研究人类智能产生的方式来让电脑模拟人的智能。对于AI产品经理做实际操作产品来说就是通过:大数据+先进算法+算力来完成的。一、数据阶段数据阶段:AI产品经理包含传统产品经理。经过数款实战产品总结,AI产品经理与传统产品经理的关系是包含关系――即AI产品经理包含传统产品经理。笔者想了一下,我们产品同学为啥总讲跟传统产品经理的区别?应该是AI产品经理核心能力应该会什么?AI产品经理的思维模式是什么?

2024-07-17 10:40:55 675

原创 LLM大模型:入职3年-我如何做一名AI产品经理(文末福利)

从2021年校招加入京东开始,我一直从事AI产品经理的工作,有幸见证了AI行业的热情从一台台服务器烧到了全世界各个角落,也见证了京东AI中台团队的影响力如何一步步的扩大。从21年的迷茫到24年的坚定,很庆幸我正走在适合自己的道路上,也有幸在此分享一些我的成长故事和观点。

2024-07-17 10:39:16 865

原创 【大模型开源推荐】本地运行自己的大模型--ollama

ollama是一款开源的、轻量级的框架,它可以快速在本地构建及运行大模型,尤其是一些目前最新开源的模型,如 Llama 3, Mistral, Gemma等。

2024-07-16 16:02:43 480

原创 LLM大模型技术的发展与实践

大模型,如GPT-3和LLaMA,是深度学习在自然语言处理中的高级形式,拥有数十亿甚至更多参数,通过预训练大量文本数据来理解和生成自然语言。

2024-07-16 16:01:15 794

Java版 愤怒的小鸟开源游戏

Java版 愤怒的小鸟开源游戏

2021-04-21

JAVA(鸡你太美)飞机游戏

JAVA(鸡你太美)飞机游戏

2021-04-21

捕鱼达人小游戏源码分享

一个已开源的java捕鱼达人游戏........

2021-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除