自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(96)
  • 收藏
  • 关注

原创 AI大模型从入门到精通:一站式学习教程

在聊到AI的时候,我们都离不开“大模型”这三个字。AI大模型已经完全融入了各个领域,也融入了我们的生活,它好像无所不在、无所不能。百度李彦宏说 :大模型改变世界;360周鸿祎说:大模型是新时代“发电厂”;李开复博士说:AI大模型是不能错过的历史机遇;……那么,究竟什么是大模型?今天我想和你深度聊聊,从概念到技术,从发展到未来,讲大模型剖析透彻,更好地看清未来方向。欢迎和我链接,一起探讨大模型的更多可能性。《中国AI大模型发展白皮书研究报告》

2024-07-04 10:44:52 884

原创 AI 大模型之美 | 更新完结

AI 大模型的美感不仅体现在其高科技的外表和复杂的内在结构上,更体现在它们带来的科技进步和社会变革中。它们是人类智慧和技术创新的结晶,不断推动着人类社会走向更加智能化和可持续的未来。如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

2024-06-26 11:19:45 1686

原创 探索2024年转行AI产品经理的黄金时机

这两年AI突然“火起来” 了 ,算是出现了一个“大转折”。因为就在这2年里,全球所有“大厂”几乎同一时间挤破头在跟进AI技术,从ChatGPT发布,到谷歌、Facebook、亚马逊等都紧跟其后,再到国内百度、腾讯、阿里、字节等也随之在冲在后面。对市场趋势敏感的产品经理们,想必也感受到了这个变化。也许你们也曾经想过要不要转行AI产品经理或者入行AI领域?那AI相关的行业究竟值不值得做?如果想转行AI产品经理,现在是不是好时机?要是决定转行,得做好什么准备?

2024-07-29 10:21:11 716

原创 MoneyPrinterPlus全面支持本地Ollama大模型

MoneyPrinterPlus现在支持批量混剪,一键AI生成视频,一键批量发布短视频这些功能了。之前支持的大模型是常用的云厂商,比如OpenAI,Azure,Kimi,Qianfan,Baichuan,Tongyi Qwen, DeepSeek这些。支持云厂商的原因是现在大模型使用基本都很便宜,并且大厂的稳定性,性能都比本地搭建要好很多。但是很多小伙伴说还是希望接入本地的LLM模型。所以,最近我对MoneyPrinterPlus进行了一些适配,最新版本已经支持Ollama了。

2024-07-29 10:18:12 203

原创 让 AI 回答更精准 来学学这些Prompt入门小技巧

了解完指令下达式提问的定义之后,那可能有的小伙伴就会有疑惑说:什么样的指令才是好的指令呢?下面这四大原则供大家参考👇🏻:特点描述结构清晰下达指令前,可以借助一些经典的结构(比如我们经常使用的5W),让自己的表达更有逻辑,更顺畅,从而形成清晰的指令。重点突出清晰地表达需求,可能会导致指令的内容较多。指令复杂,不利于AI理解提问者的需求,这时可以通过换行,突出每一条重要的指令信息。语言简练多用短句,少用长句,有助于精简信息。易于理解。

2024-07-29 10:15:00 645

原创 全方位大模型教程:从基础入门到实战应用

2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。

2024-07-28 09:00:00 1451

原创 【机器学习】GPT LoRA:大模型微调的艺术与效率

在深度学习和自然语言处理领域,大规模预训练模型(如GPT-3、BERT等)已经展示了强大的能力。然而,训练这些模型需要大量的计算资源和数据,这对于许多组织和个人来说并不现实。LoRA(Low-Rank Adaptation)作为一种轻量级的微调方法,提供了一种高效且经济的解决方案。本文将详细介绍LoRA的工作原理、应用场景、以及其在大模型微调中的优势和挑战。

2024-07-26 10:11:51 921

原创 开源教程「动手学大模型应用开发」,从零基础到掌握大模型开发的关键技能!

动手学大模型应用开发」是一个面向小白开发者的大模型应用开发教程,以个人知识库助手项目为实践目标,通过这个项目完成大模型开发的重点入门。大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,针对小白开发者的简单介绍;如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;

2024-07-26 10:08:24 334

原创 LangChain.js 实战系列:搭配 LangSmith 实现调试、监控、测试

📝 LangChain.js 是一个快速开发大模型应用的框架,它提供了一系列强大的功能和工具,使得开发者能够更加高效地构建复杂的应用程序。LangChain.js 实战系列文章将介绍在实际项目中使用 LangChain.js 时的一些方法和技巧。[LangSmith] 是 LangChain 推出的 AI 应用调试、监控和测试平台。

2024-07-26 10:06:13 767

原创 【LLM大模型】一书在手,LLM大模型通关无忧!(附PDF下载)

哈喽大家好!最近有粉丝朋友喊我推荐一些大模型的学习书籍,我给大家推荐这么一本书,基于gbt3、gbt4等transform架构的自然语言处理。这是一本对transform工作原理感兴趣的人必读的书籍。亚马逊的评分是九点七分,内行人在睡不着的时候恨不得把全书都背诵完毕。本书的写作目的是让读者能够掌握神经网络及深度学习的技术的基本原理。全书一共有十五张,作者在理论基础和时间方面都有着卓越的表现,详细的阐述了如何逐步运用全是多么技术。阅读完这本书,你将能熟练的掌握这项前沿的技术,提升你的深度学习应用能力。

2024-07-25 10:41:49 584

原创 LangChain系列教程:使用知识库修复幻觉

大型语言模型(LLMs)存在数据新鲜度问题。即使是像GPT-4这样最强大的模型,也不了解最近的事件。根据LLMs的视角,世界仿佛停滞在某个时间点。它们只知道世界是如何在它们的训练数据中呈现的。这对于依赖最新信息或特定数据集的任何用例都会带来问题。例如,您可能有一些内部公司文件,您希望通过LLM与之互动。第一个挑战是将这些文件添加到LLM中,我们可以尝试训练LLM使用这些文件,但这是耗时且昂贵的。而且当添加新文件时会发生什么呢?为每个新文件进行训练是非常低效的,简直是不可能的。

2024-07-25 10:38:08 559

原创 大语言模型超参数入门调参手册

通过深入分析,我们了解到超参数调优不仅仅是一项技术活动,更是一种艺术。它要求我们对模型有深刻的理解,对数据有敏锐的洞察,以及对目标有清晰的认识。每一次超参数的调整,都像是在与模型进行一场精心设计的对话,旨在引导它更好地服务于我们的愿景。记住,没有一成不变的最佳配置,只有不断探索和适应的最优解。让我们以这篇文章为起点,继续在 AI 的征途上,寻找那些能够点亮智慧之光的超参数组合。

2024-07-25 10:36:09 715

原创 大模型面试通关秘籍:100道精选八股文题目及解析

算法暑期实习机会快结束了,校招大考即将来袭。当前就业环境已不再是那个双向奔赴时代了。求职者在变多,岗位在变少,要求还更高了。最近,我们陆续整理了很多大厂的面试题,帮助球友解惑答疑和职业规划,分享了面试中的那些弯弯绕绕。你了解ReAct吗,它有什么优点?解释一下langchain Agent的概念langchain 有哪些替代方案?langchain token计数有什么问题?如何解决?LLM预训练阶段有哪几个关键步骤?RLHF模型为什么会表现比SFT更好?

2024-07-24 11:31:29 1127

原创 [AI Mem0] 大语言模型:一站式集成多种顶级AI模型,提升工作效率

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2024-07-24 11:29:01 543

原创 厉害了,Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI语音...

最近发现了个 AI 神器,简直是 AI 小白的福音!市面上几乎所有开源的 AI 应用,都被整合在了这个工具里了:包括 AI 绘画、AI 视频、AI 音乐、AI 数字人等各个领域。而且这些 AI 应用都可以傻瓜式地一键安装!像大家熟悉的 Stable Diffusion Web UI、ComfyUI、Fooocus、Stable Video Diffusion、StableAudio、Hallo 等等,全部可以一键安装!

2024-07-24 11:26:10 820

原创 快速上手大模型开发:《GPT-4与ChatGPT应用入门指南》,150页精华内容

如果问个问题:有哪些产品曾经创造了伟大的奇迹?ChatGPT 应该会当之无愧入选。仅仅发布 5 天,ChatGPT 就吸引了 100 万用户——当然,数据不是关键,关键是其背后的技术开启了新的 AI 狂潮,成为技术变革的点火器。就算我们这些周边吃瓜群众都日日活在 ChatGPT 带来的震撼里,更不用说在 AI 领域摸爬滚打的专家们了。

2024-07-23 10:20:53 822

原创 医疗AI前沿:AI大模型在药物靶点发现中的突破性应用

***毫无疑问,人工智能的发展对药物靶点的鉴定起到了一定帮助。但需要注意的是,这些帮助并非是颠覆性的,而是一种在目前技术框架下的优化和增强。无论是大语言模型推动的新颖靶点发现还是AI辅助的蛋白质结构预测,在医疗行业的应用都会严重受限于深度学习的可解释性和训练数据的质量。总的来说,AI在药物靶点识别中的应用无疑为我们提供了新的工具和技术,使我们能够更好地理解和解决生物医学中的一些复杂问题。但我们也应明白,AI只是一个工具,最终的药物开发仍然需要人类的智慧和努力。

2024-07-23 10:12:29 1278

原创 50K star!构建离线的私有GPT,隐私不再泄露

PrivateGPT 的思路和方向和目前很多国内的研究一致,大家都是在探索一种及使用大模型能力,同时又保障足够的数据隐私安全,并且这种引入向量存储的方法一定程度上可以提升相应的准确度的速度(在特定的问题场景下)。个人觉得这个项目更多的可以给我们延伸的思考,当然直接拿来用也不错。

2024-07-23 09:57:35 1024

原创 LangChain+sqlite3简化sql操作 =>解放双手

数据库的操作想来掘友们是炉火纯青,但是每一条增删改查语句还是得要我们自己来写,今天我带来了LangChain+sql,为大家释放双手,提高效率…

2024-07-22 10:50:12 1020

原创 2024年权威指南:一册精通LLM大模型——<大模型应用开发快速上手>必备读物!

大家好,今天给大家推荐一本大模型应用开发入门书籍《大模型应用开发极简入门》,本书对很多AI概念做了讲解和说明!朋友们如果有需要 《》,

2024-07-22 10:48:24 898

原创 你还在为写好Prompt而头疼吗,带你走进DSPy-Program LLMs之初体验

本文我们一是回顾了prompt使用过程中的痛点和问题,同时介绍了DSPy一种program的全新的大模型应用方式,并通过一个例子初步了解了DSPy是如何工作的,目前生成式人工智能社区对该框架非常感兴趣。DSPy 框架引入了一系列概念,将构建基于 LM 的应用程序从手动提示工程转向编程。

2024-07-22 10:45:19 951

原创 精选AI大模型读物:《从ChatGPT到AIGC:智能创作与应用赋能》——探索智能时代的创作力量

自2023年以来,AI聊天机器人ChatGPT火爆互联网,其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注,打开了人们对AI应用的想象空间。本书从ChatGPT入手,以AIGC为中心,对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。首先,本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解,以便读者对AIGC形成一个清晰、完整的认知。

2024-07-21 12:30:00 931

原创 利用大语言模型(LLM)探索文本分类

在快速发展的自然语言处理 (NLP) 领域,大型语言模型 (LLM) 正在开辟新天地,为古老的文本分类难题提供创新方法。这项任务涉及为文本分配预定义类别,是从情绪分析和垃圾邮件检测到内容分类等各种应用的基础。随着 LLM 成为焦点,它们带来了令人兴奋的机会和独特的挑战。让我们通过 LLM 的视角深入探究文本分类的世界。

2024-07-20 10:00:00 970

原创 大模型特征提取:揭秘AI的“火眼金睛”

想象一下,你正在看一部电影,电影里有各种各样的角色、场景和情节。但是,如果你想要描述这部电影给朋友听,你肯定会挑选出其中最精彩、最具有代表性的部分来讲述。同样地,在大模型训练中,特征提取就是挑选出数据中最重要、最有代表性的部分,以便模型能够更好地理解和处理。特征提取是大模型训练中的关键步骤之一,它能够帮助模型从数据中捕捉到最有价值的信息。无论是手工特征提取还是自动特征提取,都需要我们不断地探索和实践。希望通过这篇文章的介绍,你能够对特征提取有一个更深入的了解,并在实际的应用中发挥出它的强大威力!

2024-07-19 11:26:16 548

原创 向量数据库选择浅谈

数据库说明个人观点Qdrant1. 一个集合中可以存多种向量(图片、文字等)2. 资源占用相当少API简单易懂,有可视化页面,初学者友好,不支持混合检索,功能不够强大Weaviate1. 性能相对不错2. 支持内置嵌入3. 支持文本搜索4. GraphQL API5. 支持S3备份功能强大,花活挺多,内置嵌入初学者没啥用,没有可视化页面也不友好Milvus1. 官方支持的可视化操作界面2. 较高的搜索准确率3. 丰富的SDK4. GPU加速。

2024-07-19 11:23:34 862 1

原创 深入剖析LangChain:解构大模型的记忆增强策略

本文主要聊了安装记忆的基本原理、快速给LLM安装记忆、的使用、对话链的使用和原理。希望对你有帮助!

2024-07-19 11:21:49 660

原创 大模型算法方向实习会经常提问哪些问题? ?

现互联网研发一枚,曾拿过多个算法/研发岗SP offer,简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容,实际上可以拆解成两部分,一是算法岗通用的面试内容,二是大模型专有相关部分。算法岗通用面试内容这部分内容很重要,因为通用的面试内容可以适用于不同的研发岗,包括算法、后端开发、数据开发等等,可以“一稿多用”;此外这部分基础掌握的好,也能给面试官留下基础扎实、高潜力的印象。通用的面试内容,通常分为个人经历介绍、手撕代码、原理考察、创新性问题几部分。

2024-07-18 11:25:31 1838

原创 构建智能客服系统:利用RAG检索技术提升服务效能

RAG(Retrieval-Augmented Generation)检索技术是一种结合信息检索(Retrieval)和生成(Generation)的混合模型方法,旨在通过检索相关信息来增强生成模型的性能。RAG 技术特别适用于需要复杂背景信息或大规模知识库支持的任务,如问答系统、对话系统和文本生成等。

2024-07-18 11:21:15 897

原创 langchain循序渐进之langchain 安装及使用

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。这样,我们就可以使用检索器动态选择最相关的文档,并将这些文档传递给给定的问题。

2024-07-18 11:17:15 987

原创 大模型如何微调(通俗解读版本)

如今,大模型(Large Language Models)在人工智能领域可是炙手可热的话题。它们拥有庞大的参数和广泛的知识,能够处理各种复杂的任务。然而,就像一把锋利的刀需要经过磨砺才能更贴合手型一样,大模型也需要经过微调(Fine-Tuning)才能更好地适应特定的场景和需求。

2024-07-17 10:28:55 945

原创 智能体时代:Agent开发的三重境界

另一个典型的应用场景是新闻内容的自动总结。Agent可以接收大量的新闻数据,然后通过自然语言理解能力,提炼出关键信息,生成一份简洁的新闻日报。结合网页信息获取工具,我基于LangChain做了一个简单的[新闻总结demo]见github。在这一阶段,Agent的开发主要集中在如何更好地理解和处理自然语言上。开发者在AI领域只需要熟悉自然语言处理(NLP)的基本原理,在AI工程上用到最多的也限于提示词优化,就能够利用现有的AI模型来实现这一功能。

2024-07-17 10:27:37 855

原创 多模态人工智能是什么?

在实际应用中,多模态人工智能能够利用用户在互动过程中产生的多样化数据,如通过语音音强、语音音变、语音起伏、文本情感、语句含义、面部微表情等多种模态特征,来实现更为精确的用户心理状态评估。目前,可以评估的心理维度达十余项,包括焦虑、抑郁、压力、人际关系、适应性、积极性、价值感等。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

2024-07-17 10:24:25 593

原创 知识库+AI大模型,解锁企业知识全周期管理

在法律行业中,搭建一个有效的知识库并进行企业知识全生命周期管理确实是一项不小的挑战。法律环境的复杂性和不断变化的法规要求企业必须持续更新和维护其知识库,以确保所有信息的准确性和实时性。这种系统化的信息管理不仅有助于提高律师和法律顾问的工作效率,还能显著增强服务质量,使企业能够更快地响应客户需求,提供更精准的法律服务。除此之外,一个良好的知识库系统还是企业竞争力的关键因素之一。在法律服务市场中,能够快速准确地提供解决方案的企业往往能获得更多的市场份额和客户认可。

2024-07-16 10:42:45 879

原创 “文心•跨模态大模型”又有新动态,支持内容分析时输出自定义标签库

大模型真正的价值在于应用。一、基本概念AI 大模型具有强大的表征学习能力,能够在海量数据中提取有用的特征,为各种复杂任务提供解决方案。例如 GPT-4o、BERT 等模型的出现,不仅展示了大规模参数和复杂计算结构的优势,还在自然语言处理、图像识别等领域取得了令人瞩目的成果。同时,多模态大模型发展也为人工智能技术的多领域融合应用提供了可能。1.跨模态大模型。

2024-07-16 10:40:45 795

原创 售前工程师的AI大模型转型之路

随着人工智能技术的飞速发展,大模型(Large Language Models, LLMs)正逐渐成为IT行业的热点。对于售前工程师来说,转行大模型领域不仅意味着新的机遇,也面临着诸多挑战。本文将探讨售前工程师转行大模型领域的机遇与挑战,以及如何顺利实现转型。机遇:技术升级:大模型领域的技术不断迭代,售前工程师可以通过学习大模型相关技术,提升自己的技术水平,实现职业成长。市场需求:随着AI技术的广泛应用,大模型领域的市场需求不断增长,为售前工程师提供了丰富的就业机会。

2024-07-16 10:34:59 835

原创 程序员副业 | 2024年6月复盘

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

2024-07-15 10:37:44 798

原创 深入浅出解析:大模型、超大模型与Foundation Model技术精要

1) 模型碎片化,大模型提供预训练方案04大模型训练框架大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。掌握大模型技术你还能拥有更多可能性• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

2024-07-15 10:35:25 1206

原创 从零开始学LangChain(6):代理模块

本节是langchian源码阅读系列第六篇,下面进入代理模块👇:某些应用程序需要基于用户输入的对LLM和其他工具的灵活调用链。Agents为此类应用程序提供了灵活性。代理可以访问单一工具,并根据用户输入确定要使用的工具。代理可以使用多个工具,并使用一个工具的输出作为下一个工具的输入。主要有两种类型的代理:Plan-and-Execute Agents 用于制定动作计划;Action Agents 决定实施何种动作。Agents模块还包含配合代理执行的工具(代理可以执行的操作。

2024-07-14 16:00:00 848

原创 LangChain RAG 下册

完成第一步Query Translation之后就要进入第二步Routing,Routing的意义在于根据不同的问题类型走不同的策略,比如关系型数据库走nl2sql查询,向量查询走索引向量数据库查询。

2024-07-14 15:30:00 716

原创 阿里开源的32B大模型到底强在哪里?

阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢?

2024-07-13 10:56:28 780

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除