自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(213)
  • 收藏
  • 关注

原创 100道高频大模型面试题,看我是如何手撕面试官 脚踢hr

提供一百道面试题并保证每一道题目的详细解答达到一千字是不太现实的,因为这将会是一个非常庞大的文档。不过,我可以为你提供一系列精心挑选的大模型相关面试题目,并简要说明每个问题的重点和考察方向,这样可以帮助你准备面试。大模型面试题集总结以上这些面试题目涵盖了从基础概念到高级技术的各个方面,对于准备大模型相关职位的面试非常有帮助。建议在准备过程中,不仅要熟悉这些问题的答案,还要尝试自己动手实践,这样才能真正掌握所学知识。希望这份面试题集能帮助你在面试中脱颖而出!

2024-08-16 16:06:29 1394

原创 跨越边界:我在转型AI产品经理的一年里所积累的成长与感悟

不知不觉,已经挂着AI产品经理的title过了一年多,盘点后竟然发现,这一年中居然从0到1做了4款AI应用产品,涉及内容、营销销售、私域运营等方向,忙碌而充实。今天就结合自己这一年多的AI转型实践,和大家分享下我关于AI产品经理的一些总结和思考。在这一年多的转型旅程中,我从一名传统产品经理成长为AI产品经理,这个过程充满了挑战与收获:知识体系的重构我系统地学习了机器学习、深度学习、自然语言处理等AI基础课程,弥补了技术知识的空白。

2024-08-02 18:07:37 1518

原创 深入探究文档解析技术,助力大模型训练与应用的创新发展

探索文档解析技术是推动大模型训练与应用的重要一环。随着信息的爆炸式增长,文档数据成为了重要的数据来源之一,这些数据以多种形式存在,包括结构化数据、非结构化文本和图像等。因此,有效地解析和理解这些文档数据对于提升大模型性能与拓展大模型应用至关重要。在此背景下,大模型训练与应用需要依赖先进的文档解析技术来处理复杂的文档数据。

2024-07-19 11:41:07 1518

原创 初识LangChain的快速入门指南

LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。

2024-06-29 20:56:14 1557

原创 从零开始认识大模型,入行必读!

大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。

2024-06-24 13:47:24 1985

原创 作者硬核,内容透彻接地气的多模态大模型通识读本!(送书)

多模态人工智能是研究、开发用于模拟、延伸和扩展类人的多模态智能的理论、方法、技术及应用系统的一个重要的研究方向。多模态人工智能融合了多种模态数据,如文本、图像、音频和视频等,使机器能够更好地理解和处理复杂的信息。因此,对多模态人工智能的研究具有重要的科学意义和广泛的应用价值。这种技术已经在智能驾驶、医疗健康、娱乐等多个行业得到实际应用,并且正在加快技术创新的步伐,成为推动各行各业进步的重要动力。随着模型和算力的发展,多模态人工智能模型也许会像智能手机一样成为扩展、改造人类生产和生活的必备工具。

2024-08-23 10:53:20 454

原创 Llama 3.1 70B与Mistral Large 2 128B深度对比

在过去几天里,新模型如雨后春笋般涌现。首先是 OpenAI 推出的 GPT-4o mini 模型,然后是 Meta 发布的庞大的 405B 参数模型。现在,法国公司 Mistral 刚刚发布了其名为 Large 2 的新旗舰模型。Meta 的 Llama 3.1 70B 和 Mistral Large 2 128B 代表了两个突出的大型语言模型,在人工智能领域取得了显著进展。这些模型对于需要高级自然语言理解和生成的任务至关重要,它们的开发标志着人工智能领域的显著进步。

2024-08-23 10:50:58 727

原创 Llama 3.1开源:LLM领域的新里程碑

随着 Llama 3.1 的开源,人工智能的未来已不再遥不可及。它不仅为消费者带来了更高效、更精准的智能工具,更为全球开发者社区注入了创新的活力。在技术的不断演进中,Llama 3.1 无疑将成为推动 AI 领域进步的关键力量。让我们期待,这股开源的力量如何激发更多的智慧火花,共同书写人工智能的新篇章。

2024-08-23 10:48:30 311

原创 35岁程序员转行大模型:如何把握行业机遇与个人发展

对于一位35岁的程序员想要转行到大模型领域,这是一个很好的时机,因为人工智能和大模型技术正在快速发展,并且有着广泛的应用前景。以下是一些具体的步骤和建议,可以帮助您顺利地完成这一转变:基础知识学习数学基础:线性代数、概率论、统计学、微积分等。编程基础:熟练掌握Python编程语言,因为它是在大模型开发中最常用的编程语言。机器学习基础:了解监督学习、非监督学习、强化学习等基本概念。深度学习基础:熟悉神经网络、卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等。

2024-08-22 21:06:03 1139

原创 大模型提示工程(Prompt)(下篇),思维链和思维树的进阶

我们梳理和了解了ChatGPT在不擅长的领域,一些提示方法。这些深度的内容希望能在接下来帮助我们理解和掌握更加进阶的提示工程技巧,以便在大模型开发中实现更高效的应用和优化。

2024-08-22 21:03:41 894

原创 大模型提示工程(Prompt)(上篇),掌握Prompt原理与技巧,提高AI生成内容质量

关于ChatGPT等的账号如何注册,这里不再说描述,网上教程一搜一大把。好多人有这样一种感觉,拿到ChatGPT的账号,一顿尝试操作,当你过了新鲜的阶段,发现不好用,ChatGPT 回答的好空,没有太多参考价值;或者说,发现自己好像并没有什么好问的,不知道可以用 GPT 怎么来使用,于是过了这阵风,可能好久也想不起来再登录一次了。然而实际情况是,不管是相关技术从业者还是其他行业的从业者,越来越多的人正把它变为自己的生产力工具。

2024-08-22 21:01:49 711

原创 《驾驭未来:大型语言模型的理论与实践》—— 探索大模型的奥秘

在这个信息爆炸的时代,人工智能尤其是大型语言模型(LLM)已经成为推动科技进步的关键力量。无论是科学研究、商业应用还是日常生活,大型语言模型都在不断地改变着我们的世界。对于那些渴望深入了解这一前沿技术的人来说,《驾驭未来:大型语言模型的理论与实践》无疑是一本不可多得的好书。书籍概览《驾驭未来:大型语言模型的理论与实践》是一本综合性的著作,旨在为读者提供从基础理论到实际应用的全面指导。本书由知名人工智能专家团队编写,他们不仅在学术界有着深厚的理论功底,也在业界积累了丰富的实践经验。

2024-08-21 21:31:13 1025

原创 作为普通程序员,我们该如何学习大模型(LLM),学习路线和知识体系

原谅我的后知后觉,才开始从头写,我是已经上了一阶段大模型的课,也搜集了些资料,并自己做了小部分实践,回过头来,才想开始整理些文章。起初,大家都在写,都在发,我那会在焦虑。自chatgpt爆火以来,AI技术又被广泛关注,国内外各大厂商也纷纷布局,作为我们每一个普通人,也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我,相信绝大多数程序员也有和我一样的感受,从一开始的新奇,到焦虑,到试图去了解他,到去尝试,并致力于应用。

2024-08-21 21:27:36 723

原创 “AI大模型入门教程:专为初学者设计的第一讲

这个是大模型系列课程的第一节。接下来我带着大家一起拥抱新技术,分享的进展不会很快,大概一周一次,有空可以直播讲解或实操。为了照顾那些工程出身,甚至非技术同学,我这个系列会从小白开始,从基础概念入门逐步展开。声明:我不会研究基础大模型,而是会关注应用层,当然也会涉及预训练、知识库、多智能化跟模型最终效果息息相关的部分。废话不多说,赶快上车。我们先理解一下什么是大模型,先从 ChatGPT 来学习大模型。

2024-08-21 21:23:49 660

原创 不懂AI技术的产品经理,都会被淘汰!

当下社会,终身学习是这个时代的必修课。未来几年,不懂AI技术的产品经理可能会被淘汰。原因有以下几点,大家共勉吧!要避免被淘汰,产品经理需要认识到AI技术的重要性,并积极学习和应用这些技术,以保持自己的竞争力和市场相关性。同时,他们也需要培养跨学科的沟通能力和团队协作精神,以促进AI技术在产品开发中的有效应用。整理的,为你插上AI的翅膀!

2024-08-20 11:32:54 816

原创 大模型全面解析:从零基础到精通的必备指南,非常详细收藏我这一篇就够了

大模型的定义大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。大模型的基本原理与特点大模型的原理是基于深度学习,它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数,使得模型能够在各种任务中取得最佳表现。

2024-08-20 11:31:21 991

原创 免费PDF分享!《AI大语言模型的基础与前沿》—— 程序员必备的大模型经典著作

全球首个完全自主的 AI 软件工程师上线,它是来自 Cognition 这家初创公司的产品——Devin, 这个名字也随即引爆了科技圈。话说 Devin 有多能干?它能实现端到端的完整项目开发。也就是说,只需一句指令,Devin 就可以从零构建出一个完整互联网应用,其他工作还可以自主查找并修复代码中的 bug,甚至是训练和微调自己的 AI 模型。更厉害的是,Devin 还通过了一家 AI 公司的技术面试,并且在 Upwork 上完成了实际工作。

2024-08-19 13:42:22 831

原创 微软新一代RAG II实战教程:GraphRAG与Neo4j强强联合,实现结果可视化

文接上回,GraphRAG的发布在技术界引起了轩然大波,业内大佬纷纷开始入局研究,其中就包括了neo4j的CTO Philip Rathle。他的一篇文章讲述了GraphRAG在GenAI领域强大的潜力《The GraphRAG Manifesto: Adding Knowledge to GenAI》进一步点燃了公众对GraphRAG的热情,今天我们讲尝试GraphRAG生成的图导入Neo4j实现图可视化展示。

2024-08-19 13:39:44 962

原创 AI语言大模型商业价值深度解析

AI语言大模型的定义与分类主要围绕其核心特征和应用场景展开。

2024-08-18 11:25:35 637

原创 AI产品经理的核心素养:深入理解用户需求与技术原理

Hidecloud的看法是,AI产品的核心竞争力可能在于低prompt或0prompt的设计,让用户能够以极低的输入成本获得高价值的娱乐体验。Hidecloud举了一个实际的例子,在早期开发dodoboo时(涂鸦AI绘画产品),工程师觉得可以让生成的图像直接用作继续创作的基础。这种做法不需要用户提供详细的prompt,基本实现了0prompt的交互方式。实验表明,这样的设计能够极大地提升用户的娱乐体验,因为它简化了用户的操作,同时使得创作过程变得更加有趣和吸引人。

2024-08-18 11:23:46 384

原创 LLM三角原则解析:简化大模型应用开发的秘籍

LLM三角原则提供了一个基础框架,帮助我们在开发产品时发挥LLMs的功能。这个框架基于三个主要的元素:模型、工程集成、上下文数据,以及一套详细的操作步骤(SOP)。

2024-08-18 11:21:28 714

原创 指令微调在渠道业务测试用例AI大模型中的应用

Self-Instruct是一个半自动的过程,从有限少量的手动编写的种子任务开始,使用大模型以引导的方式生成新的大量任务,用于指令微调。完整的流程可以分为6步,如下图:

2024-08-16 16:02:48 948

原创 秋招大模型岗位求职学习路线,快上车了秋招已至,决战大厂!

随着人工智能领域的快速发展,特别是自然语言处理(NLP)方向,大型预训练模型(简称“大模型”)成为了当前研究与应用的热点。大模型因其卓越的语言生成和理解能力,在各个行业得到了广泛应用。如果你正计划在今年秋季招聘季寻找一份与大模型相关的工作,那么你需要具备扎实的技术基础和一定的实践经验。下面是一条详细的学习路线,帮助你系统地准备,顺利进入这一领域。一、基础知识准备在深入学习大模型之前,你需要先掌握一些基础的数学和编程技能,这将为你后续的学习打下坚实的基础。

2024-08-15 11:25:55 638

原创 大模型算法面试终极指南:答案全解析

算法在大模型面试中扮演着至关重要的角色。它不仅测试了候选人的基础技能和问题解决能力,还反映了他们的逻辑思维、推理能力、创新能力和团队合作精神。因此,准备充分并在算法面试中表现出色对于成功获得大模型相关职位至关重要。目前主流的开源大模型体系有哪些?GPT系列:由OpenAI发布,包括GPT-1、GPT-2、GPT-3、ChatGPT等。GPT模型通过在大规模无标签文本上进行预训练,然后在特定任务上进行微调,具有很强的生成能力和语言理解能力。

2024-08-15 11:22:30 997

原创 AI知识库构建秘籍:利用RAG技术实现智能升级

RAG]或检索增强生成是一种技术,它使LLM能够访问知识库中的相关文档。它允许 LLM 根据访问的文档生成准确的响应。首先,搜索知识库以查找响应用户查询的信息。然后,将最合适的搜索结果作为上下文添加到提示中,并添加一条指令,例如:“仅使用以下段落中的信息来回答以下问题”。如果您使用的 LLM 模型未针对指令进行调整,则需要添加示例来演示预期输入和预期输出的外观。包含指令、搜索结果和输出格式的提示文本将发送到 LLM 模型。LLM 使用来自上下文的信息来生成准确的响应。

2024-08-15 11:20:40 618

原创 AI产品经理速成技巧:从入门到精通的实操指南,非常详细收藏我这一篇就够了

ChatGPT的爆火,让人看到了新的生产力发展方向,微软也因此放弃了元宇宙,ALL In AI,各大巨头和资本也陆续进入,誓要打造中国版的ChatGPT,并觉得人工智能可以改写现有的程序应用场景,带来新的生产力变革。**一位长者曾经说过,一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程。**作为产品经理,我们只有躬身入局,才能不会错过这次AI带来的时代红利。

2024-08-14 11:31:30 549

原创 轻松打造:基于本地知识库的私有GPT助手定制教程”

众所周知,目前大模型 LLM 的能力已经非常强大,chatgpt 已经可以很好的解决通用型问题,但是对于垂直专业领域的问题处理的还不够好。如果要利用 LLM 大模型根据已有的特定领域的知识,推理出该领域特定问题的答案,将是一种不错的应用方向。例如,下面是一个开源医学领域的 GPT 助手:法律领域的助手:相对于通用大模型如 chatgpt,私有问答助手的专业性要更高。此外,如果是一些私有的领域,通用大模型是没有相关知识的,因此无法回答。因此我们需要实现自己的私有 GPT 助手。具体是怎么实现的呢?

2024-08-14 11:28:47 610

原创 嵌入式与WLAN-langchain+langGraph实现硬件与服务端的多agent交流

内网穿透也叫做内网映射,也叫“NAT穿透”简单来说就是,让外网能访问你的内网;把自己的内网(主机)当成服务器,让外网能访问。内网穿透原理图:内网穿透的工具:“Sunny-Ngrok”,"贝锐花生壳"等。

2024-08-14 11:26:26 731

原创 大模型面试题集锦:揭秘阿里24k Star项目背后的争议,非常详细收藏我这一篇就够了

随着ChatGPT的出圈,大语言模型层出不穷,并展现出非凡的能力,可以有效地解决各种问题。然而,这些模型通常需要大量的计算资源和内存,导致运行时资源消耗较高,限制了其在某些场景下的应用,让很多研究者望而却步。本项目使用通俗易懂的语言介绍模型的剪枝、量化、知识蒸馏等压缩方法,让更多的小白能更快了解到模型压缩技术。

2024-08-13 11:07:36 743

原创 AI产品经理知识库:深入解析AI与大模型的差异,非常详细收藏我这一篇就够了

在人工智能(AI)的领域,我们常常听到“大模型”和“传统AI”这两个术语。那么,这两者之间究竟有何区别?今天,我们就来深入探讨一下这个问题。1、大模型(LLM)是基于深度学习算法的,使用大规模的神经网络模型进行训练。这使得LLM具有更强大的语言处理能力和生成能力。而传统AI通常使用基于规则、模板和手工特征工程的浅层算法,难以处理复杂的语言任务。LLM可以根据任务需求进行灵活的调整和扩展,以适应不同的应用场景。而传统AI则通常需要重新设计和实现算法和模型,无法快速地适应新的应用需求。

2024-08-13 11:04:51 967

原创 开源医疗大模型排行榜: 健康领域大模型基准测试

多年来,大型语言模型 (LLMs) 已经发展成为一项具有巨大潜力,能够彻底改变医疗行业各个方面的开创性技术。这些模型,如 [GPT-3],[GPT-4] 和 [Med-PaLM 2],在理解和生成类人文本方面表现出了卓越的能力,使它们成为处理复杂医疗任务和改善病人护理的宝贵工具。它们在多种医疗应用中显示出巨大的前景,如医疗问答 (QA) 、对话系统和文本生成。此外,随着电子健康记录 (EHRs) 、医学文献和病人生成数据的指数级增长,LLMs 可以帮助医疗专业人员提取宝贵见解并做出明智的决策。

2024-08-13 11:02:17 686

原创 这本书太好了!150页就能让你上手大模型应用开发

先让我们细细看看这本书有哪些特别之处(因为本书封面上是一种很特别的动物——刺蛇尾,本书别名「蛇尾书」)。

2024-08-12 10:40:24 692

原创 探索前沿:热门开源AI大模型项目精选,零基础入门到精通,非常详细收藏我这一篇就够了

1.NNI优点:全面支持机器学习生命周期的各个环节,易于上手,开发者友好。缺点:可能对于特定领域或特定问题的优化不够深入。适用场景:各种机器学习项目,尤其是神经网络相关的项目。2.AdaNet优点:轻量级,易于使用,能够创建高质量的模型,节省选择神经网络架构的时间。缺点:对于特定问题的优化可能不如专业模型深入。适用场景:需要快速原型设计和模型迭代的场景。3.SAIL 7B优点:基于LLaMa的搜索增强模型,具有强大的搜索和学习能力。缺点:模型参数较大,可能需要较高的计算资源。

2024-08-12 10:38:43 992

原创 LangChain系列教程:掌握Callbacks模块,精通AI大模型应用开发

本文我们学习了LangChain的Callbacks模块,实践了各种 CallBack 的用法,知道了怎么利用LangChain进行写日志文件、Token计数等。这对于我们debug程序和监控程序的各个阶段非常重要。

2024-08-12 10:35:02 738

原创 大模型全解析:从入门到精通的必读指南,非常详细收藏我这一篇就够了

在数字化时代,数据如同海洋般浩渺,而如何在这片海洋中寻找到有价值的“宝藏”呢?答案或许就隐藏在我们称之为“大模型”的技术中。今天,就让我们一起踏上这场从大模型入门到精通的奇妙之旅,探索其背后的奥秘与价值。

2024-08-11 19:00:00 731

原创 超越代码:LLM与AIGC的融合未来

这篇文章尝试捕捉从传统编程到AI思维的转变,并展望了LLM在未来编程中的作用。未来的编程将是编程技能与AIGC素养的结合。开发者需要学会如何编写有效的Prompt,这就像是给LLM下达指令,让它成为一个编程助手。这种全栈的能力,将使得开发者能够更快地实现想法,并创造出更加丰富和多样的数字产品。随着LLM技术的不断进步,我们正迎来一个编程与AI思维相结合的新时代。在这个时代中,LLM不仅仅是一个工具,更是一个合作伙伴,它将帮助开发者释放创造力,推动数字世界的发展。

2024-08-11 17:00:00 1475

原创 大模型面试八股+答案,LLM-offer手到擒来!

你是否也曾为面试大模型八股文而苦恼?别担心!今天我就来给你分享一些绝妙的面试技巧,让你轻松应对!🔍 第一关:了解题目首先,一定要仔细阅读题目,理解清楚每个要求。明确问题的关键词,有助于你有针对性地准备答案。比如,如果题目问到“大模型的优势和劣势”,你就要分别列举出来,并提供具体例子来支持你的论点。🚀 第二关:结构清晰大模型八股文常常需要有清晰的结构,让你的回答更有条理,让面试官一目了然。可以采用“提出观点-论证-举例-总结”的结构,这样既有逻辑性,又能让你的回答更加生动有趣。

2024-08-10 15:33:50 1672

原创 大模型应用(十)如何指导agent像人一样思考,一文看懂所有思维链范式,示例和最佳实践

agent是模型面向应用的中间层,通常理解为是一个类人的智能体,为了让agent更像一个人,我们可以引导模型像人一样思考。思维链(CoT)通常作为一种引导模型思考的方法被广泛使用。思维链(CoT) 被认为最具开拓性和影响力的提示工程技术之一,它可以增强大型语言模型在决策过程中的表现。与传统的提示方法强调直接的输入和输出互动不同,CoT迫使模型将推理过程划分为中间步骤。这种方法类似于人类的认知过程,将复杂的挑战分解为更小、更易于管理的部分。通俗点说,就是引导模型一步一步思考,最终得到答案。

2024-08-10 15:27:01 645

原创 Llama3云平台免费使用保姆级教程,附对话效果演示

AI一天,人间一年。

2024-08-10 15:24:10 1035

原创 彻底掌握:大模型RAG面试题深度解析

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

2024-08-09 11:32:06 846

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除