自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(152)
  • 收藏
  • 关注

原创 2024年史上最难就业季,该如何逆风翻盘?

IT互联网依然是大学生最向往行业,制造业受欢迎度升高智联招聘调研数据显示,2024届求职毕业生期望行业中,IT/通信/电子/互联网、政府/非盈利机构、文化/传媒/娱乐/体育行业位列前三,占比分别为26.4%、9.4%、8.9%。IT互联网行业为应届生贡献很多就业岗位,也是应届生最向往的行业。

2024-06-20 13:43:59 2996

原创 AI产品经理,应掌握哪些技术?

当下,人工智能AI产品经理这一块不失为一个好的发展方向吗,如果你想要快速入局却又找不到方法,那么在这里我为大家总结了一套系统的学习方法,方便大家成型的学习,有需要的朋友可以扫描下方二维码,免费获取更多相关学习资料。

2024-06-17 19:47:49 1216

原创 ChatGPT等大模型可以代替搜索引擎吗?

在知乎看到一个问题,回答了一下,分享到这里。把ChatGPT当作搜索引擎可靠性差点,但是可行。

2024-06-14 10:01:37 1739 3

原创 金融与大模型:引领行业未来的创新融合

金融与大模型的结合是行业发展的必然趋势,也是金融行业实现数字化转型和创新发展的关键。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。通过强调金融大模型的优势、打造成功案例、建立合作关系和创新服务模式等多种手段相结合的方式,共同推动金融大模型在行业的广泛应用和普及发展。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。

2024-06-13 13:44:07 2704

原创 程序员为什么要学习AI大模型?

在科技浪潮的推动下,人工智能(AI)技术已经成为推动软件行业发展的核心动力。而在AI技术的众多分支中,AI大模型以其巨大的潜力和广泛的应用场景,逐渐成为了程序员们关注的焦点。本文将从程序员的角度出发,探讨AI大模型的定义、应用,以及为何程序员需要深入了解大模型的相关知识。

2024-06-06 18:26:08 2628 1

原创 大模型不再高冷,这本书带你轻松入门 LangChain

本书深入介绍了 LangChain 平台和大模型的核心概念、应用和实战经验。从 LangChain 的架构出发,逐一讲解了模型输入/输出、检索、链、记忆和代理等核心组件,并结合丰富的开发场景以详细的代码呈现给读者。此外,本书还将通过几个具体案例来展示如何综合运用所学知识,通过这些案例,读者不仅可以掌握 LangChain 的实用技术,还可以提升解决实际问题的能力。本书既适合初学者快速入门 LangChain,深入了解大模型领域的最新技术,也适合专业开发者拓展技能,上手大模型应用的开发。

2024-07-22 11:05:45

原创 【最新出版】2024年权威指南:《LLM大模型一通到底》——<大模型应用开发极简入门>,开启你的AI学习之旅!

大家好,今天给大家推荐一本大模型应用开发入门书籍《大模型应用开发极简入门》,本书对很多AI概念做了讲解和说明!朋友们如果有需要 《》,

2024-07-21 11:15:00 642

原创 【AI大模型应用开发】3.2 RAG实战 - RAG应用+UI实现加载本地文件并对话

前面我们实现了RAG基本流程,今天我们在此基础上给它加个UI界面,在浏览器打开,实现上传本地文件、解析,并用大模型实现与该文档的对话。也就是一个阉割版demo版的ChatPDF或知识库对话系统。界面采用Python的gradio库,这个库在机器学习和大模型界很火,它运行后会启动一个Web服务器,并在默认浏览器中打开一个新页面,显示Gradio界面。别问为啥用这个,就是看大模型的界面好多都是这个库搭的,所以也就用一下。不会gradio没关系,就几行代码,很容易理解。

2024-07-20 10:30:00 736

原创 揭秘开源大模型争议:是真开源还是假开源?

人工智能在近几年的飞速发展,不仅打破了很多传统技术和习惯,也让全球围绕大模型生态迎来了全新的赛道之争。尤其是从去年开始,全球互联网大厂掀起了“百模大战”,大家耳熟能详的互联网大厂如微软、谷歌、百度、阿里等接连下场,经过半年多的发力,这些科技巨头围绕着大模型生态而面临选择开源大模型还是闭源大模型。

2024-07-19 11:47:33 786

原创 Llama3-8B到底能不能打?实测对比

前几天Meta开源发布了新的Llama大语言模型:Llama-3系列,本次一共发布了两个版本:Llama-3-8B和Llama-3-70B,根据Meta发布的测评报告,Llama-3-8B的性能吊打之前的Llama-2-70B,也就是说80亿参数的模型干掉了700亿参数的模型,这个还真挺让人震惊的。Llama-3-8B真的有这么强吗?鉴于8B的模型可以在24G显存下流畅运行,成本不高,我就在AutoDL上实际测试了一下。

2024-07-19 11:45:19 1299

原创 手把手教你创造你的本地私人 ChatGPT(上):本地大模型 Ollama

Ollama 是一款强大的本地大模型运行工具,可以帮助你轻松下载和运行各种 LLM 模型,而无需将数据上传到云端。通过 Ollama,你可以生成创意内容、翻译语言、构建问答系统、聊天机器人等等。Ollama 的安装和使用非常简单,只需几个命令即可完成。如果你想体验 LLM 的强大功能,不妨试试 Ollama 吧!

2024-07-19 11:43:58 641

原创 热搜揭秘:「13.11>13.8」引发热议,一道题目挑战AI智慧?LLM模型的潜在缺陷大曝光

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。「第一步,填满6升的壶,第二步,把水从6升壶倒入12升壶,第三步,再次填满6升壶,第四步,非常小心地把水从6升壶倒入12升壶。

2024-07-18 11:45:28 920

原创 深入解析AutoGen AI Agents框架:构建多代理群聊实例的步骤详解

在前面几篇文章中,我们一起入门了AutoGen, 了解了Assistant和UserProxyAssistant 两个agent 间的chat协作模式,并结合案例,观察了执行流程。这篇文章, 我们一起来玩一下GroupChat和GroupManager这两个群聊的功能。一想想,就有点小激动,安排各种agent, 相互聊天,就代替人类把活给干完了。程序员只需要使用GroupChat 或 GroupManager把agents组织起来,就可以"八仙过海",就可以"复仇者联盟了"…

2024-07-18 11:40:38 301

原创 轻松上手Spring AI:开启全民大模型运行新篇章

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

2024-07-18 11:38:50 230

原创 大模型vs陪诊师,谁来为“患者”的健康买单?

诚然,在这场大模型与人工陪诊员的竞逐中,我们不仅要考虑谁来为患者的健康买单,更要考虑如何确保这项技术的发展能够惠及更广泛的人群。而AI陪诊师的未来,也势必需要行业内外的共同努力。通过制定合理的“价格”策略、加强数据安全与隐私保护、提升AI的社交智慧、明确责任归属等朝着一个更加高效、安全、人性化的医疗陪诊服务体系迈进。

2024-07-17 11:01:46 811

原创 DSPy实战:三十分钟无痛上手自动化Prompt框架

DSPy 是一款功能强大的框架。它可以用来自动优化大型语言模型(LLM)的提示词和响应。还能让我们的 LLM 应用即使在 OpenAI/Gemini/Claude版本升级也能正常使用。无论你有多少数据,它都能帮助你优化模型,获得更高的准确度和性能。通过选择合适的优化器,并根据具体需求进行调优,你可以在各种任务中获得出色的结果。在官方教程中使用LLM 为,数据集为在线的ColBERTv2 服务器,托管维基百科 2017 年“摘要”搜索索引问答数据集使用了HotPotQA数据集中的一个小样本。

2024-07-17 10:58:20 881 1

原创 一文为你深度解析 LLaMA2 模型架构

LLaMA 由 Meta AI 公司2022年发布的一个开放且高效的大型基础语言模型,共有 7B、13B、33B、65B(650 亿)四种版本。其数据集来源都是公开数据集,无任何定制数据集,整个训练数据集在 token 化之后大约包含 1.4T 的 token。LLaMA 的性能非常优异:具有 130 亿参数Llama 模型「在大多数基准上」可以胜过 GPT-3( 参数量达 1750 亿),而且可以在单块 V100 GPU 上运行;

2024-07-17 10:56:09 611

原创 周末推荐一篇LLM的必读好文

LLM 即大语言模型,是一种生成式 AI,它基于大量数据(以 PB 计)进行训练,可以对任何类型的问题生成新颖的回答,这就是 “生成式” 名称的由来。**这些模型基于 Transformer 架构,需要非常大的 GPU 数据中心。**这儿要提一下,训练 ChatGPT 花费了大约 1 亿美元。这些模型非常庞大,无法安装在任何一台服务器上;它们的参数数量以万亿计。认识这些模型的方式是将它们视为一个创意生成机器。它们可以生成或给出任何文本查询的近似答案,即使它们在之前没有见过类似的东西。

2024-07-16 11:22:30 478

原创 大模型,再一次爆发!

随着GPT大热“AI大模型”无疑是最火爆的话题!等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有算法相关岗位,需求最大,薪资最高**优秀的AIGC算法工程师年薪高达96w!**作为普通程序员,(不限年龄!不限岗位!IT人都可学习!掌握AI大模型技术,成为超级个体大模型的发展历程与训练方法解析AI技术应用场景如何用LangChain、Fine-tuning 定制你的专属大模型应用借助大模型技术提高收入的可能性……2天直播+直播互动答疑!扫码领直播,即可免费学习!

2024-07-16 11:20:53 1702

原创 在本地跑一个大语言模型(3) - 让模型自主使用工具

根据OpenAI官方文档,是使得大型语言模型具备可以连接到外部工具的能力。简而言之,开发者事先给模型提供了若干工具(函数),在模型理解用户的问题后,自行判断是否需要调用工具以获得更多上下文信息,帮助模型更好的决策。举个例子:在[上一篇文章])我们是利用将事先准备好的文本作为上下文提供给模型,而使用以后,我们只要提供一个“搜索函数”作为工具,模型即可自己通过搜索引擎进行搜索然后得出答案。

2024-07-16 11:18:49 317

原创 从零到一,深入浅出大语言模型的奇妙世界

2022 年底,OpenAI 发布的 ChatGPT 模型在全球范围内引起了巨大轰动。本文详细的介绍了大语言模型的发展历程、构建过程和大语言模型如何使用等知识,帮助大家搞懂大语言模型。

2024-07-15 10:56:36 816

原创 什么是大模型?同学听我说

大模型(Big Model)是指在机器学习和人工智能领域中处理大规模数据和复杂模型的一种方法或技术。随着数据量的不断增加和模型的复杂度提高,传统的机器学习方法已经无法有效处理,因此大模型成为了解决这一挑战的重要工具之一。本文将介绍大模型的基本概念、应用场景以及一些常见的大模型技术。大模型是指在处理大规模数据和复杂模型时所采用的一种模型和算法。大模型通常需要处理海量的数据,这些数据可能来自于互联网、传感器、日志文件等各种来源。

2024-07-15 10:54:55 877

原创 LLM微调方法(Efficient-Tuning)六大主流方法:思路讲解&优缺点对比[P-tuning、Lora、Prefix tuing等]

自然语言处理的一个重要范式包括在通用领域数据上进行大规模预训练,并适应特定任务或领域。随着我们预训练更大的模型,全面微调(即重新训练所有模型参数)变得不太可行。以GPT-3 175B为例,部署独立的微调模型实例,每个实例都有175B参数,成本是极其昂贵的。我们提出了低秩适应(Low-Rank Adaptation,简称LoRA),该方法冻结预训练模型的权重,并在Transformer架构的每一层中注入可训练的低秩分解矩阵,从而大大减少了下游任务的可训练参数数量。

2024-07-13 13:46:08 997

原创 谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说

谷歌大改 Transformer,“无限” 长度上下文来了。现在,(100 万 token,大约相当于 10 部小说),并能完成 Passkey 检索任务。的书籍摘要任务中,拿下最。这就是谷歌最新提出的(无限注意力)。它能让 Transformer 架构大模型在有限的计算资源里处理无限长的输入,在内存大小上实现。什么概念?就是在内存大小不变的情况下,放进去 114 倍多的信息。好比一个存放 100 本书的图书馆,通过新技术能存储 11400 本书了。这项最新成果立马引发学术圈关注,大佬纷纷围观。

2024-07-13 11:59:34 809

原创 快速体验 Llama3 的 4 种方式,本地部署,800 tokens/s 的推理速度真的太快了!

北京时间4月19日凌晨,Meta在官网上官宣了Llama-3,作为继Llama1、Llama2和CodeLlama之后的第三代模型,Llama3在多个基准测试中实现了全面领先,性能优于业界同类最先进的模型,你有没有第一时间体验上呢,这篇文章就分享下如何在Groq上以超过 800 tokens/s 的魔鬼推理速度体验Llama3,会同时分享Web端、移动端、API方式以及集成到LangChain中4种体验方案。我的新书[《LangChain编程从入门到实践》]已经开售!

2024-07-12 10:03:32 1172

原创 27岁程序媛未来的出路到底在哪里?

帮助很多人得到了学习和成长。

2024-07-12 10:00:55 969

原创 从零开始学 langchain 之搭建最小的 RAG 系统

RAG 可以说是 23 年以来到现在,最为火热的大模型应用技术了,很多人都有了很多经典的研究。而对于新人来说,有些代码十分复杂,导致只看表象并不理解其原理。今天,就利用 langchain 和大家一起搭建一个最简单的 RAG 系统,一起来学习一下吧。

2024-07-11 10:06:52 419

原创 历经20家国内大模型岗位面试,我被誉为准专业卷王传奇

​大模型近来是火爆了,小伙伴们问我大模型现在是泡沫吗?目前,大模型在技术上是成熟的,并且在多个领域展现出了巨大的潜力。然而,它们是否能够持续产生价值、实现商业化成功,并适应监管和社会的变化,将是决定它们是否是泡沫的关键。因此,对于这个问题的答案,需要随着时间的推移和市场的变化而不断评估。接下来给大家分享真实的大模型岗位面试,在最后会给大家分享一份面经。希望能够帮助到大家。

2024-07-11 10:04:43 669

原创 LangChain.js 实战系列:入门介绍

如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-07-10 13:48:39 730

原创 想学习人工智能、大语言模型?这份学习路线与免费学习资源最值得推荐

想学习人工智能吗?但不知道如何开始?要熟练掌握人工智能相关的技术,光学习很多课程是不够的。为了摆脱只是跟着教程学习,你需要亲自动手,从头开始编写算法,动手实践,并通过使用人工智能解决问题来做一些有趣的边项目。这篇文章试图创建一份免费的课程路径,希望对大家学习有帮助。(注意:有大量教程、书籍、论文和资源都是英文的,请配合 AI 翻译工具来阅读吧。

2024-07-10 13:46:56 1259

原创 很多人对AI Agent的理解太片面

做过 PDF 翻译的都知道,要得到好的翻译结果,将 PDF 的内容整理成 Markdown,再让大语言翻译,效果是相当好的。去年起 AI 大热,一个很重要的原因是 LLM 的出现,这些模型一方面确实能力强大,有一定的通用性,有简单的推理能力,另一方面使用也简单,无论是通过聊天机器人,还是通过 API 调用,都能很方便的使用。这是一个典型的设计好流程的适合 AI 的工作流,AI 只需要做简单的情感分析和回复生成,而不需要做复杂的决策,这样的工作流可以很好的提升效率,并且结果也相对靠谱。如果人工做会怎么做?

2024-07-09 11:04:40 952

原创 突发!马斯克3140亿参数Grok开源!Grok原理大公开!

科技巨头之间AI之间的大规模竞争,争相发布各种最厉害最前沿的大语言模型,然后最终受益的却还是我们普通个人。就想前几年的手机竞争,厂商们都在制作各种旗舰机型,所以后面就有了越来越大的手机,屏幕越来越高清,摄像头的像素越来越大,手机摄像头也越来越多。除了了解这些最前沿的科技之外,我们还可以思考如何更好地将这些技术应用在我们日常的工作和生活之中。如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

2024-07-09 11:02:10 600

原创 AI 大时代要懂的 2 种「编程范式」

2023 年 AI 新突破导出不穷,隔两个月就会有一个爆点出来,AI 迎来了一个新的里程碑时刻。从 OpenAI 推出的 ChatGPT 到 Midjourney 发布的 V5/V6 版本,AI 在各个领域都取得了突破性的进展。随着 AI 技术的日益成熟,我们也开始思考如何更好地利用 AI 工具来提高工作效率。到 2024 年, AI 应用、AI 配套的框架和工具如雨后春笋。在这个 AI 大时代,有两种「编程范式」值得我们关注。为什么要打上引号呢?

2024-07-08 11:30:26 985

原创 机械设计师转大模型岗位,我是抓住风口的猪,真能起飞!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;CAD和CAE集成:了解如何将机器学习模型集成到CAD和CAE软件中,以自动化设计流程。

2024-07-08 11:27:09 1176

原创 人工智能模型评估:全面解析与方法体系

如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-07-04 13:55:14 626

原创 AI大模型实战进阶:内容审核应用深度解析

内容审核是指对互联网上的内容进行审核的过程,主要包括文本、图像、音频和视频等多种形式的内容。随着互联网的普及和用户生成内容的增加,内容审核的重要性也不断提高。人工审核不能满足需求,因此需要借助人工智能技术来自动化审核。AI大模型在内容审核领域具有广泛的应用前景,可以帮助企业和组织更有效地管理和审核内容。

2024-07-04 13:37:47 1026

原创 LangGraph进阶:手把手教你打造电影脚本AI

MAS可以是每个智能体有自己独立的LLM、提示词、Tools或者其他自定义代码,用来与其他智能体协作,比如一个虚拟的AI软件公司,可以由多个独立的LLM智能体来担任架构师、程序员、测试人员等多个角色;这里的多智能体体现在AI会根据提示扮演不同的角色,并根据情节发展做自主对话。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

2024-07-03 17:50:37 508

原创 企业应用探秘:大模型AI Agent的六种基础类型

因此,你可以通过简单的配置后,在你的AI助手中通过API来对接这些工具,可以大大拓展你的AI助手的“工具库”。**OpenInterpreter:**当前最强大的开源代码解释器,完美地复刻了OpenAI的代码解释器实现,但是可以完全在本地部署与使用,利用它来实现本地的数据分析与可视化是一个不错的选择。理想中的AI Agent是在丢给他一个工具包与一些知识以后,借助于大模型的理解、推理能力,完全自主的规划与分解任务,设计任务步骤,并智能的使用各种工具,检索知识,输出内容,完成任务。

2024-07-03 17:46:12 979

原创 我在国企当合同工的那段日子

好像说了跟没说一样,那说具体点吧,比如说业主那边需要云,但怕私有云厂商垄断坐地起价,所以说一般配额划分为“7/3”、“4/3/3”、“6/4”,这样就有两套云系统,为了用起来顺心就需要一个集成系统,所以说我这个项目组的业务来源就是这样,至于你说的我们集成系统会不会垄断坐地起价,拜托,我们系统只会集成,没有底层设备控制权,坐地起价就直接禁用就行了,就不用这个系统呗,反正资源在另外的云操作系统中。公司的缝缝补补,工作的缝缝补补,项目的缝缝补补,这样的缝缝补补渐渐地缝补在人身伤,人心里。原来有些迷茫到彻底迷茫;

2024-07-02 11:04:51 813

原创 拥抱 AI 时代:LangChain 框架快速入门指南

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。为了让生成的公司名称更加随机,我们需要初始化模型封装器,并使用高温度的参数来进行初始化,这将确保我们生成的名称更具创造性和多样性。虽然聊天模型在底层使用语言模型,但它们暴露的接口有点不同:它们没有暴露“文本输入,文本输出”的API,而是将聊天消息(ChatMessage)列表作为输入和输出。

2024-07-02 10:59:43 289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除