自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(97)
  • 收藏
  • 关注

原创 AI大模型入门宝典:全面知识点解析,新手必备干货大全!

当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。

2024-07-13 10:41:51 1346

原创 清华博士带你掌握 Llama 大模型 40 节课助你涨薪 120%

可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2024-06-07 17:48:23 1604

原创 《35岁编程老兵欲进军大模型领域,转行攻略一览》

1. 基础知识学习:首先,你需要掌握一些基础知识,如机器学习、深度学习、神经网络等。可以通过在线课程、书籍、研讨会等方式进行学习。例如,你可以学习TensorFlow、PyTorch等深度学习框架。2. 实践操作:理论知识学习后,通过实际操作来加深理解。你可以尝试自己实现一些简单的模型,或者在Kaggle等平台上参加数据科学竞赛,通过实际项目来提升自己的技能。3. 关注行业动态:了解大模型领域的最新研究动态和应用场景。

2024-07-22 10:42:08 821

原创 《初探大模型应用开发——此书不容错过,助你快速上手!》

前段时间,人民邮电出版社送了我一本最新出版的《大模型应用开发极简入门:基于GPT-4和ChatGPT》,今天有幸一口气读完了这本书,干货多多,非常适合作为当前开发者进入大模型开发领域的敲门砖,值得人手一本。这本书深入浅出地介绍了如何利用GPT-4和ChatGPT构建AIGC应用程序的方法和技巧。在这本书中,作者详细解释了GPT4的主要特点和优势,同时提供了丰富的Python代码示例和实用案例,让读者能够轻松理解和应用这些概念。

2024-07-22 10:36:48 342

原创 本地电脑使用ollama部署大模型并安装Chatbox:一文看通透

某些场景下可能希望构建一个完全本地离线可用的大模型,方法很多,模型也很多,比如 qwen、qwen2、llama3等,最简单快捷的首推使用 ollama 部署,模型选用 qwen 或 qwen2,针对中文任务效果更好。

2024-07-22 10:34:53 673

原创 成功转行AI大模型开发全攻略:实战教程与高效学习路线详解

转行AI大模型开发难吗?怎么学才能找到工作?这应该是所有新人都会面临的问题,所以我结合自己的经历,做了一些总结和学习方法,希望能对大家有所帮助。

2024-07-21 15:45:00 545

原创 【专业著作】复旦力作!全面解读大规模语言模型:理论探究与实践应用

自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT, GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。今天给大家推荐一本大模型方面的书籍,本书将介绍大语言模型的基础理论包括语言模型、分布式模型训练以及强化学习,并以Deepspeed-Chat框架为例介绍实现大语言模型和类ChatGPT系统的实践。书籍作者😝有需要的小伙伴,可以V扫描下方二维码免费领取==🆓。

2024-07-20 09:00:00 238

原创 AI大模型时代来临!盘点国内11家顶尖AI大模型企业(附体验链接)

阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。

2024-07-19 11:16:57 1486

原创 自己搭建的AI如何用,你知道吗?

目前开源的AI大语言模型(LLM)已经非常的多了,以下是收集的一些LLM:LLaMA2023-06-26日上传至github,目前51.3k star。

2024-07-19 11:13:43 721

原创 详解可本地部署的AI方案:同数据库进行无障碍中文问答

第4步,根据以上数据,将结果交给大模型进行总结。如果觉得总结的不好,你也可以加上一些prompt引导,最终获得一条可阅读的结论。调用的接口是 api/v0/generate_summary。

2024-07-19 11:12:13 586

原创 医疗大模型推动医学推理与临床决策,开启医患问答与病历自动化新篇章

目前大多数开源的ChatLLM项目使用的是其他模型(如:ChatGPT)生成的指令数据,其不可避免的存在数据幻想的问题,数据幻想问题将严重影响LLM在实际场景中的应用和拓展。

2024-07-18 11:12:55 950

原创 初识LLM大模型:入门级工程知识探索与解析

源自脉脉上面刷到的大模型业务工程落地可以做的方向。其实如果不是接触相关工作,有的人可能不会想了解这方面,自己实习做的方向与之相关,因此想调研总结一下行业热点方向与基础入门知识,还有一些的专业词汇的解释。

2024-07-18 11:04:44 973

原创 【LangChain系列教程】AI大模型应用开发——实战操作LangChain智能体Agents模块

可以是一个函数或三方 API也可以把一个 Chain 或者 Agent 的 run()作为一个 Tool在上面的例子中,我们使用了官方内置的Tool:serpapi,这也是可以自己定义的。例如下面的代码,自定义了一个weekday的工具。# 自定义工具tools += [weekday] ## 将自定义的tool添加到tools数组中。

2024-07-18 10:59:44 614

原创 大模型训练数据集:揭秘AI的“知识宝库”

简单来说,数据集就是一组数据的集合,这些数据可以是数字、文字、图片、音频等多种形式。在大模型训练中,数据集扮演着至关重要的角色,它就像是AI的“教材”,让模型能够从中学习并掌握知识。数据集是大模型训练的基石,它承载着AI的“知识”和“智慧”。通过理解数据集的概念、收集方法和使用技巧,我们可以更好地利用这个“知识宝库”,推动人工智能的发展和应用。在这个数据驱动的时代,让我们共同探索和利用数据集的力量,为创造更美好的未来贡献一份力量!

2024-07-17 10:18:30 660

原创 为什么都放弃了LangChain?

或许从诞生那天起,LangChain 就注定是一个口碑两极分化的产品。看好 LangChain 的人欣赏它丰富的工具和组建和易于集成等特点,不看好 LangChain 的人,认为它注定失败 —— 在这个技术变化如此之快的年代,用 LangChain 来构建一切根本行不通。夸张点的还有:「在我的咨询工作中,我花了 70% 的精力来说服人们不要使用 langchain 或 llamaindex。这解决了他们 90% 的问题。

2024-07-17 10:13:34 735

原创 爆火的无人驾驶萝卜快跑,背后有哪些隐忧?

不得不说,现在的人工智能技术,特别是那些超大的智能模型,简直就是坐上了火箭,嗖嗖地往前冲,对经济、社会还有咱们的日常生活,影响大得不得了!这变化,比工业革命和信息技术革命加起来还要猛烈呢!就在不久前的上海世界人工智能大会上,澳大利亚科学院院士、新南威尔士大学教授托比·沃尔什,在出席“人工智能新进展与社会科学的未来”论坛时指出,要深入研究人工智能发展给人类带来的影响,尤其是在就业方面,并不是所有工作人工智能都做得比人类好,在谋划未来、创意工作和提供情绪价值等方面,人类具有不可取代的优势。

2024-07-17 10:10:38 857

原创 盘点2024国内热门AI大模型:哪个最好!

近年来,中国AI技术迅猛发展,特别是在大模型领域取得了显著成就。众多科技巨头和初创企业纷纷推出各具特色的AI大模型,这些模型在智能问答、知识推理、内容创作等多个方面展现出强大的能力。今天,我们来盘点一下国内几个主流的AI大模型。

2024-07-16 10:27:09 1229

原创 一群追星星的人,对 AI 的盼与怕

面对 AI,有人害怕,有人期盼。“AI 和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了 AI 的能力进化过临界点,我们普通人根本就跟不上,或快或慢被淘汰。看起来,AI 正在给人类制造新的困境。怕 AI 可以理解,那盼 AI 的人,到底在期盼什么呢?前不久我在 WAIC 2024 上,发现了一个由孤独症儿童的父母、志愿者所组成的普通开发者团体,用 AI 给“来自星星的孩子”做绘本,这将“星宝”照护者们拉出了困境。

2024-07-16 10:25:34 301

原创 从前端程序员到大模型算法岗的华丽转身

在当今科技飞速发展的时代,前端程序员们正面临着前所未有的机遇与挑战。随着人工智能技术的崛起,大模型算法岗逐渐成为前端程序员们转型的新选择。本文将探讨从前端程序员转行大模型算法岗的机遇与挑战,以及如何顺利实现这一华丽转身。机遇:技术升级:大模型算法岗涉及机器学习、深度学习等前沿技术,从前端程序员转型为大模型算法岗,意味着技术水平的提升和职业发展的跨越。市场前景:随着AI技术的广泛应用,大模型算法岗的市场需求不断增长,为前端程序员提供了丰富的就业机会和广阔的发展空间。

2024-07-16 10:23:24 467

原创 无人驾驶出租车事故频发的启示:如何用好AI这把双刃剑?

大家早上中午下午晚上好,我是大飞。最近无人驾驶出租车可谓是大火,百度股价也是随之大涨,但随之而来的是引发的多起安全事故,以及靠出租车吃饭这个群体的抗议。不禁令人深思两个话题,一、如何确保科技发展的安全性。二、人工智能的发展和人类需求本身如何找到这个平衡点。看到这张图就想笑,是啊,不管科技怎么发展,时代怎么变迁,受苦难都是底层老百姓,吃到时代红利的只是一小部分,AI只是工具,却不是我们的工具。当真讽刺。

2024-07-15 12:17:13 896

原创 全方位解读:揭秘全网热议的“大模型技术”,一文掌握其精髓!

2006年Geoffrey Hinton提出通过逐层无监督预训练的方式来缓解由于梯度消失而导致的深层网络难以训练的问题,为神经网络的有效学习提供了重要的优化途径。此后,深度学习在计算机视觉、语音、自然语言处理等众多领域取得了突破性的研究进展,开启了新一轮深度学习的发展浪潮。

2024-07-15 10:28:19 633

原创 人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

SFT监督微调时监督微调时,学习率通常会设置得很小常见误区:1.监督微调需要大量的训练时间和数据 2.监督微调将复制源模型的所有参数至目标模型 3.监督微调只需要几十条监督数据即可监督微调常见任务:1.用中文预训练BERT模型完成中文实体识别任务 2.训练语言模型GPT3 3.UIE模型在垂直领域的数据集上微调常见误区:在ImageNet上的预训练的模型再来训练目标检测任务 (则不是)目前,主流的SFT监督方法包括:LoRA、P-tuning v2、Freeze。

2024-07-14 11:00:00 882

原创 给 「大模型初学者」 的 LLaMA 3 核心技术剖析

”这样的问题时,期望的回答自然是“白色(white)”。仅需具备一定的 Python 编程基础,并对神经网络和 Transformer 架构有基本的认识,便能跟随本文的指引,观察 LLaMA 3 如何根据输入生成输出,见证它如何基于输入生成连贯且有意义的文本。—— 如前文所述,LLaMA-3 采用的是 tiktoken 库中的字节对编码(BPE)分词技术,这项技术是在一个包含了 15 万亿个 tokens 的超大数据集上训练得来的,比 LLaMA-2 使用的数据集足足大了7倍之多。

2024-07-14 06:15:00 550

原创 苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。如此种种,苹果向外界传达了加注 GenAI 的决心。

2024-07-13 10:43:48 1008

原创 一周涨8K star!RAG技术迎来大升级,速度关注

GraphRAG是一个非常好的想法,通过知识图谱和RAG的组合,可以极大提高当前RAG的性能,但其成功取决于 LLM 首先能够更好地提取关系,同时并非所有数据都是或可以以图形结构展示,这样的考虑会产生什么影响,尚待观察。

2024-07-12 09:45:29 576

原创 手把手教你部署并使用国产开源大模型ChatGLM3-6B

部署一个自己的大模型,没事的时候玩两下,这可能是很多技术同学想做但又迟迟没下手的事情,没下手的原因很可能是成本太高,近万元的RTX3090显卡,想想都肉疼,又或者官方的部署说明过于简单,安装的时候总是遇到各种奇奇怪怪的问题,难以解决。本文就来分享下我的安装部署经验,包括本地和租用云服务器的方式,以及如何通过API调用大模型开发自己的AI应用,希望能解决一些下不去手的问题。

2024-07-12 09:43:41 974

原创 糟糕!我不小心让AI超负荷了!

大型语言模型(LLMs)已经展现出了强大的能力,但在实际应用中仍面临很多挑战,如模型幻觉、知识更新缓慢以及答案缺乏可信度等。LLM 虽然是在非常庞大的数据集上训练的,但并不是在您的数据上训练的。检索增强生成(RAG)通过将您的数据链接到 LLMs 来解决这个问题。RAG 是一种将知识检索与生成模型相结合的技术,可以提高问答系统的准确性和相关性。它通过从外部知识源中动态检索信息,并将检索到的数据作为参考来组织答案,从而能有效缓解 LLM 中存在的幻觉问题。RAG 系统。

2024-07-11 09:52:18 806

原创 程序员掌握AI大模型的必要性:解锁职业发展新机遇

在科技浪潮的推动下,人工智能(AI)技术已经成为推动软件行业发展的核心动力。而在AI技术的众多分支中,AI大模型以其巨大的潜力和广泛的应用场景,逐渐成为了程序员们关注的焦点。本文将从程序员的角度出发,探讨AI大模型的定义、应用,以及为何程序员需要深入了解大模型的相关知识。

2024-07-11 09:48:47 629

原创 自定义 LLM:LangChain与文心一言擦出火花

call:它需要接受一个字符串、可选的停用词,并返回一个字符串。:用于帮助打印 LLM 信息。该函数应该返回一个字典。使用LLM模块来封装我们的模型接口,可以带来许多好处,其中之一就是有利于与LangChain的其他模块进行协同工作。​​​​"""使用 API Key,Secret Key 获取access_token"""​​​​"""temperature 说明:(1)较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。

2024-07-10 13:33:49 945

原创 解密 AI 客服:LangChain+ChatGPT 打造智能客服新时代

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

2024-07-10 13:32:07 725

原创 27 岁的程序员 Gap 一年感受

最大的感受:变成 28 岁了好吧,开个玩笑,下面是正文。

2024-07-09 10:11:29 871

原创 万字详解:RAG的五大步骤与十二优化策略

RAG概述ChatGPT、GLM等生成式人工智能在文本生成、文本到图像生成等任务中表现出令人印象深刻的性能。但它们也存在固有局限性,包括产生幻觉、缺乏对生成文本的可解释性、专业领域知识理解差,以及对最新知识的了解有限。为了克服这些限制,提高模型的能力,有两种主要途径:一种是微调(Fine Tune)来更新模型,另一种是让他们能够与外部世界互动,以不同的形式和方式获取知识。微调固然效果好,可以让模型真正的“学会”一些私域知识。但是微调也会带来几个问题:首先,由于生成模型依赖于内在知识(权重),因此模型还是无法

2024-07-09 10:05:12 790

原创 20K star!手把手教会你搞定 LLM 微调,超详细收藏我这篇就够了

在人工智能领域,大型语言模型(LLM)微调(Fine-Tuning)是当下最热门的话题之一。总体来说LLaMA Factory 是一个非常优质的工具,在LLM微调中帮助用户节省了大量的精力。这些模型拥有惊人的语言理解和生成能力,但要微调和部署它们以适应特定任务,往往需要大量计算资源和专业知识,代码调试还得有深厚的技术功底。

2024-07-08 10:51:05 993

原创 我是售前工程师转大模型了,不装了我摊牌了

有无售前工程师的朋友,心里的苦谁懂呀,售前工程师是项目开发人员与业务销售人员的桥梁,在业务销售人员眼中,他们是技术人员,在项目实施中的开发人员眼中,他们是专注技术的销售人员,在用户眼中,他们则是代表公司技术水平的技术专家。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

2024-07-08 10:48:00 770

原创 全方位解析:现象级AI大模型热潮

在聊到AI的时候,我们都离不开“大模型”这三个字。AI大模型已经完全融入了各个领域,也融入了我们的生活,它好像无所不在、无所不能。百度李彦宏说 :大模型改变世界;360周鸿祎说:大模型是新时代“发电厂”;李开复博士说:AI大模型是不能错过的历史机遇;……那么,究竟什么是大模型?今天我想和你深度聊聊,从概念到技术,从发展到未来,讲大模型剖析透彻,更好地看清未来方向。欢迎和我链接,一起探讨大模型的更多可能性。《中国AI大模型发展白皮书研究报告》

2024-07-04 10:33:07 996

原创 精通AutoGen:AI Agents框架精髓

这就是AutoGen如何使用,帮助我们将大语言模型的工作流拆分成独立的、可控的、可调试的小的功能单元,以Agent的形式存在,Agent与Agent之间的基于对话的交流,完成自动化的,基于大语言模型工作流的执行。如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

2024-07-04 10:28:57 957

原创 轻松五步:AI大模型本地搭建简易指南

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2024-07-03 10:35:51 1146

原创 AI大模型探秘:核心能力与应用场景深度解析

通过概念考察的方式,拆开来了解AI大模型。AI:包含很多术语,如:模式识别、自然语言处理、神经网络、机器学习、深度学习、强化学习、人类反馈强化学习等。大模型:把LM比作人的大脑。

2024-07-03 10:29:44 237

原创 我使用 GPT-4o 帮我挑西瓜

发现还有伙伴和我一样体验到了不错的应用场景,当我使用手机版的 GPT-4o ,我可以实时拍照询问它,给我一些建议,如何挑西瓜榴莲等,询问给出差异分析,借助 AI 的力量进行挑瓜。那么,就让我们了解 GPT-4o 这个大模型吧,首先 GPT-4 是比 3.5 版本更强的版本,即为 4.0+,后面还有一个‘o’ ,它的全称是‘Omni’,即‘全能’的意思。如果 AI 没有被一方人污染,升级完全体的情况下,它真的能够为我们参谋很多,洞悉很多潜在的信息,毕竟你能骗我,但是 AI 不会骗我。

2024-07-02 10:25:34 783

原创 一文带你速通RAG、知识库和LLM!

定制知识库是指一系列紧密关联且始终保持更新的知识集合,它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态(比如:MySQL),也可以表现为一套非结构化的文档体系(比如:文件、图图片、音频、视频等),甚至可能是两者兼具的综合形式。

2024-07-02 10:22:55 862

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除