自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1286)
  • 收藏
  • 关注

原创 Meta发布开源人工智能模型Llama 3.1

早在今年4月,Meta就透露说,它正在开发人工智能行业的第一款产品:一个性能与OpenAI等公司最好的私有模型相媲美的开源模型。今天,该大模型已经问世。Meta发布 Llama 3.1,这是有史以来最大的开源人工智能模型。Meta声称,Llama 3.1在几个基准测试上的表现优于gpt-4o和Anthropic的Claude 3.5 Sonnet。Llama 3.1还在更多国家和语言中提供基于 Llama 的 Meta 人工智能助手,同时增加了一项功能,可以根据某人的特定形象生成图像。

2024-07-25 18:21:23 342

原创 Llama 3.1逆袭,GPT-4瞬间不香了。

Llama 3.1的诞生,是这种理念的完美实践。

2024-07-25 18:20:11 588

原创 Llama3.1正式发布,Meta引领开源新时代

Llama 3.1系列模型包括8B、70B和405B三个尺寸,其中405B模型以其卓越的性能成为全球最强大的开源大模型之一。它在常识、可操纵性、数学、工具使用和多语言翻译等方面可与顶级AI模型相媲美。Llama 3.1 405B的上下文长度扩展到了128K,支持八种语言,并且在长文本摘要、多语言对话智能体和编码助手等高级用例中展现出色的表现。

2024-07-25 18:18:34 571

原创 大语言模型笔面试

简单来说,如果梯度的大小超过了设定的阈值,我们将其按照比例缩放,使得缩放后的梯度大小正好等于阈值。这样可以防止梯度过大。

2024-07-24 11:52:24 1128

原创 大模型面试之Pretrain时如何做好拼接

大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。从大模型系统设计入手,讲解大模型的主要方法;

2024-07-24 11:50:34 537

原创 Transformer高频面试题!!

如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!😝有需要的小伙伴,可以保存图片到。

2024-07-24 11:47:54 633

原创 视觉Transformer效率大比拼,45种模型的全面评估

Transformer模型自从在自然语言处理(NLP)领域取得突破性进展以来,迅速成为了机器学习和人工智能研究的热点。Transformer的核心在于其自注意力机制,这种机制能够捕捉输入数据中远距离依赖关系,使得模型在处理序列数据时表现出色。最初Transformer模型主要应用于语言任务,如机器翻译、文本生成和问答系统。随着研究的深入,Transformer模型的应用范围逐渐扩展到计算机视觉(CV)领域,特别是在图像分类、目标检测和图像生成等任务中。

2024-07-23 11:45:47 841

原创 Transformer,一个神奇的算法模型!!

嗨,大家好!今天介绍一个神奇的机器学习模型——Transformer。Transformer 非常多的人很熟悉,不过也有人有点模糊,咱们今天来说道说道~

2024-07-23 11:40:51 241

原创 深入解析与应用:一篇文章带你搞懂Transformer模型

Transformer模型自从2017年问世以来,迅速成为自然语言处理(NLP)领域的核心技术。它的强大性能不仅在NLP中得到验证,还在计算机视觉等领域展现出卓越的表现。本篇文章将详细介绍Transformer的基本原理及其使用方法,帮助大家深入理解Transformer模型。Transformer的核心结构包括两个主要部分:编码器(Encoder) 和 解码器(Decoder)。每个部分又由多个层堆叠而成。编码器由N层相同的子层(sub-layer)堆叠而成。每一层包含两个主要子层:多头自注意力机制(Mu

2024-07-23 11:39:51 871

原创 行业大模型实现方式

行业大模型的构建和应用中,由于需求和目标不同,技术实现复杂性差异也较大。。在机构的具体实践中,通常不会只用一种方式,而会组合使用,以实现最佳效果。例如,一个高质量的智能问答系统,会综合使用提示工程、检索增强生成和精调等方式。提示工程检索增强生成精调预训练适用场景快速探索应用,如对话系统。交案创作荐优化提升,可以显著提升生产内容的质量需要引用大量外部知识,如问答系统,专业咨询等生成内容准确性高,保障自有数据所有权希望通用大核型在行业应用场景表现更好具有较好的行业泛化能力。

2024-07-22 19:48:20 787

原创 适用于语言学习的大语言模型汇总

随着人工智能技术的飞速发展,大语言模型在语言学习中的应用日益广泛。相较传统的语言学习方式(比如报班、刷题和看外语剧等等),大语言模型在成本投入、学习效率、便捷性和灵活性等方面都有着绝对的优势。这些模型可以从多个维度帮助语言学习者:1.提供即时反馈:大语言模型可以对学习者的句子进行语法和语义分析,提供即时纠正和建议,帮助学习者提高语言的准确性。2.对话练习:学习者可以与模型进行对话练习,模拟真实交流环境,增强口语.3.词汇扩展:模型可以根据学习者的需求,提供丰富的词汇和表达方式,帮助学习者扩展词汇量。

2024-07-22 19:45:37 663

原创 大语言模型机器学习框架

大语言模型是自然语言处理(NLP)领域中使用的一种技术,它们通过训练大量文本数据,从而学会理解和生成人类语言。大语言模型是自然语言处理(NLP)领域中使用的一种技术,它们通过训练大量文本数据,从而学会理解和生成人类语言。这些模型通常采用深度学习方法,其中最常用的是变形金刚(Transformer)机器学习框架。在机器学习领域,有很多种技术框架可以用来构建和训练这些大语言模型。选择哪个框架通常取决于个人偏好、项目需求以及团队的熟悉程度。每个框架都有其优点和适用场景。一、常用的机器学习框架。

2024-07-22 19:43:55 986

原创 Ollama 本地CPU部署开源大模型

Ollama可以在本地CPU非常方便地部署许多开源的大模型。如 Facebook的llama3, 谷歌的gemma, 微软的phi3,阿里的qwen2 等模型。完整支持的模型列表可以参考:https://ollama.com/library它基于llama.cpp实现,本地CPU推理效率非常高(当然如果有GPU的话,推理效率会更高), 还可以兼容 openai的接口。本文将按照如下顺序介绍Ollama的使用方法~⚫️ 下载安装Ollama⚫️ 命令行交互⚫️ python接口交互。

2024-07-18 19:38:53 645

原创 如何成为成功的AI产品经理

1 AI产品经理的角色和职责2 AI产品经理的必备知识技能3 案例分析4 总结一下随着ChatGPT的大热,也带动今年的AI火了一把,很多公司都开始进行相关部署,自然产生了很多岗位需求。来源:BOSS直聘那么,要想当AI产品经理,你该去了解什么,知道什么,我们今天讲下「」系列的第二节,,我们拆分几个方面,再加上一些案例分析,让大家更好地理解。可以回顾下,做PMS产品经理。01 AI产品经理的角色和职责。

2024-07-18 19:38:08 983

原创 大模型LLM的三种微调方法的经验分享&总结

PT方法占用显存更大,因为也增加了很多而外参数;测试耗时,采用float16进行模型推理,由于其他方法均增加了额外参数,因此其他方法的推理耗时会比Freeze方法要高。当然由于是生成模型,所以生成的长度也会影响耗时;模型在指定任务上微调之后,并没有丧失原有能力,例如生成“帮我写个快排算法”,依然可以生成-快排代码;

2024-07-18 19:37:24 858

原创 真的爆赞! 52个大模型应用落地应用案例集

2023大模型落地应用案例集》是一本详细解析大模型在各领域应用现状和发展趋势的书籍。这本书通过收集和整理大量的实际应用案例,为我们提供了大模型在实际业务中应用的宝贵参考。首先,该书收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,充分展示了大模型技术在各个行业中的广泛应用前景。这些案例不仅体现了各行业对大模型技术的关注度和认可度,也为大模型技术的进一步推广和应用提供了动力。资料内容介绍:专家人工系统 :一个时间流上的故事,事前事中和事后三个环节上的故事。

2024-07-17 21:00:48 1247

原创 程序员入门大模型,这份2024年畅销书单不容错过!

知乎上,"这一话题引爆了超过50万读者的热烈讨论。作为程序员,我们应当是最先了解大模型的人,也是率先成为了解大模型应用开发的人,今天,我精心整理了一份以大模型学习、人工智能基础为主题的书单,一起来学习吧!本书将以生动活泼的笔触,将枯燥的技术细节化作轻松幽默的故事和缤纷多彩的图画,引领读者穿梭于不同技术的时空,见证自然语言处理技术的传承、演进与蜕变。在这场不断攀登技术新峰的奇妙之旅中,读者不仅能深入理解自然语言处理技术的核心原理,还能自己动手,从零开始搭建起一个又一个语言模型。

2024-07-17 20:59:17 1071

原创 大模型应用,这些书不能错过!

在这个信息爆炸的时代,人工智能正以前所未有的速度和规模渗透到我们生活的方方面面。其中,大模型应用作为 AI 领域的一大亮点,不仅在学术界引起广泛关注,更在工业界展现出巨大的应用潜力。从自然语言处理到图像识别,从数据分析到智能推荐,大模型以其强大的学习能力和泛化能力,不断刷新着我们对机器智能的认知。日常工作或者学习中,虽然人人都用在用大模型,但是不同的人使用的效果可谓千差万别。面对大模型,究竟要怎么快速应用到工作中,这些问题不管是程序员还是普通职场人都会遇到。

2024-07-17 20:56:24 1193

原创 多模态大语言模型研究进展!

多模态大型语言模型(MM-LLMs)在过去一年取得了显著进步,通过优化模态对齐和与人类意图对齐,增强了现成的单模态基础模型(LLMs)以支持各种MM任务。本文对MM-LLMs进行了全面综述,包括模型架构和训练流程的概述,以及122个最新进展的MM-LLM分类系统。本文还介绍了输出投影器在机器翻译中的作用,并讨论了模式生成器、训练管道、SOTAMM-LLM以及未来发展方向。MM-LLMs具有较高的性能,未来发展方向包括扩展模型模式、多样化LLM、提高MM生成能力和开发更具挑战性的基准。

2024-07-16 13:47:35 543

原创 大语言模型(LLM)工作的3个步骤,一文带你搞清楚!

知其然,更要知其所以然。

2024-07-16 13:45:26 856

原创 大语言模型工作基本原理

总的来说,大语言模型是一种通过学习大量的文本数据,来理解语言的规律和模式的计算机程序。它通过神经网络算法,来预测和理解新的语言输入。虽然它的理解和预测并不是完全准确的,但是随着技术的不断发展,它的能力也在不断提高。

2024-07-16 13:42:50 893

原创 AI大语言模型学习笔记之一:大型语言模型(LLMs)概览

当谈及当下火热的 AI 大型语言模型时,我们其实是在说一种神奇的软件,它能够以和我们一样自然的语言方式“交流”。这些隐藏在计算机里的家伙真的很厉害——时常让我们感觉像魔法,它们不仅能以酷似人类语言的方式开口说话,而且能在对话中理解上下文语境,产出仿佛是来自真实人类的回应。这些语言模型通过啃下大量文本数据,学到了人类语言使用的种种套路。它们犹如语言大师,凭借学到的一套又一套技巧,写出的文本几乎难以分辨是机器还是真人的杰作。

2024-07-16 12:29:51 1007

原创 大模型技术将如何改变推动汽车行业?

大模型技术正在迅速崛起,对汽车行业的设计、制造、运营和服务环节产生深远影响。这项技术不仅为智能座舱和自动驾驶带来颠覆性变革,还对新能源汽车智能化进程中的“下半场”发挥重要作用。然而,大模型的应用也伴随着数据、算力、算法及系统安全等多重挑战。本文将深入探讨大模型在汽车行业的应用前景及面临的难题,并提出相应建议。大模型技术的迅猛发展已超越了汽车产业的创新速度,成为解决汽车行业难题的关键推动力。具有毁灭性:大模型的引入将颠覆传统的汽车设计和制造方式,重塑整个行业格局。

2024-07-11 16:09:38 1023

原创 大模型在财富管理行业的应用探索

在当今金融投资多元化的买方投顾时代,投资者对于资产保值增值和极致体验的需求日益旺盛。展望未来,风景这边独好,大模型技术在财富管理领域的应用必将开拓无限可能,每个投资者都可能化身“数字人”,也将拥有不止一个“智能体”私人金融顾问。领先财富管理机构只有不断革新用户体验、拓宽业务边界,才能获取增量业务、降低风险损失、改善运营成本,提升客户满意度,创造更多业务价值。

2024-07-11 16:06:48 958

原创 AI大模型应用在哪些行业场景?

随着人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。自2023年7月至2024年6月,从接待封闭开发的客户数据看,【北京doublebee封闭研发空间】的新客户几乎都是做人工智能的。不难看出,由于我国高度重视人工智能的发展,将其上升为国家战略,出台一系列扶持政策和规划,为AI大模型产业发展创造了良好的环境,各企业都在跃跃欲试,踩住机遇,迎风口前行,将大模型产业的应用落地将进一步被提速。

2024-07-11 15:57:47 857

原创 大模型(LLM)在金融投资领域的应用

通用领域的大型语言模型(LLM)如GPT系列、Llama系列和BERT,在许多自然语言处理任务中表现优异,这激发了针对金融领域的专用LLM的开发。这些专门模型通过大量金融数据的训练,提升了它们在理解和生成金融相关内容方面的能力。在金融LLM中,Ploutos尤为值得关注。它源自GPT-4,专注于可解释的股票走势预测,结合多模态数据和专家分析,能够生成量化策略和准确的股票预测。尽管存在专家选择偏见和计算复杂性等挑战,Ploutos仍表现出色。

2024-07-11 15:53:31 1242

原创 本地快速私有化部署和运行大语言模型

ollama是一个快速部署和运行大语言模型的开源工具,https://ollama.com/。通过它可以在终端与大语言模型交互,而且安装非常的简单,支持非常多的模型,并且可以随意切换模型, 支持模型地址:https://ollama.com/library如果你想使用LLM模型但是又不想暴露你的私人数据到公网,不放试一试这个方法。执行安装命令这样就安装好了。使用 命令ollama -h看看有哪些参数在命令帮助信息中可以看到可以使用serve启动它,

2024-07-08 22:00:36 568

原创 中国大模型发展的独特优势与私有化趋势

从2023年下半年开始,大模型在大家的视听里出现的次数越来越多,关于大模型的落地和实际应用,讨论和分析的声音不绝于耳,大厂商在努力的研发和推出各自的大模型平台,集成商和信息化企业在研究大模型的行业应用和落地方案,而众多的开发者则在关注这个方向的知识学习和职业机会。总之,AI和大模型的发展搅动了各行各业,给未来的创新和发展制造了许多的可能性,作为开发者的我们要走的更长远,要踩上时代的红利,不但要看清大势,也要务实学习和实践,今天就说一说大势。一、AI发展的大国竞争和中国优势。

2024-07-08 21:58:32 699

原创 产品经理与AI:共生与创新的未来

产品经理和人工智能(AI)之间的关系是现代技术发展中一个非常有趣且复杂的主题。随着AI技术在各个领域的应用日益广泛,产品经理的角色也正在经历着前所未有的变革。产品经理与人工智能:共生与创新的未来在当今数字化时代,人工智能(AI)已经成为推动各行各业创新和转型的关键力量。作为技术和商业策略的桥梁,产品经理的角色在AI时代显得尤为重要。本文将探讨产品经理与AI之间的关系,以及这种关系如何塑造未来的产品开发和市场策略。传统的产品经理主要负责定义产品愿景、规划产品路线图、协调跨职能团队以及确保产品满足市场需求。

2024-07-08 21:55:33 1127

原创 大模型技术讲解:大模型参数微调

BERT是一种基于Transformer的预训练语言表示模型,它能够通过双向训练来学习语言特征。BERT模型有多种尺寸,常用的有BERT-Base(bert-base-uncased)和BERT-Large(bert-large-uncased),分别拥有110M和340M的参数。

2024-07-08 21:52:35 879

原创 如何准备大模型调优训练的数据集?

根据已有的预训练大模型,精调出自己的私有大模型,是通用大模型走向企业应用和个人应用的重要方向。目前,大部分的通用大模型已经向大众开放,用于在其基础上调优训练出专有的AI模型。例如:百度千帆大模型平台,该平台目前提供20多个基于大量的无标注数据,结合不同的训练方式训练出定制的预训练模型。在这些预训练模式的基础,借助千帆大模型平台,我们可以通过四个步骤,调优训练出专业大模型:数据准备、大模型训练、大模型管理、大模型服务。其中,第一个步骤就是数据准备,而数据准备的开始就是建立自己的数据集。

2024-07-03 15:33:21 1118

原创 一款大模型框架,专注私有数据处理

Embedchain 是一个开源的 RAG 框架,倡导的设计原则是”常规但可配置",旨在为软件工程师和机器学习工程师提供便捷。Embedchain 能够简化 RAG 应用的创建流程,无缝管理各类无结构化数据。它可以有效地将数据切分成易于管理的段落,生成相应的嵌入,并将其存储在向量数据库中以实现优化检索。通过多样化的 API 集合,用户能够提取上下文信息,查找准确答案,或参与互动聊天会话,所有这些都能够量身定制来满足自己的数据要求。

2024-07-03 15:30:02 685

原创 从开发到部署,搭建离线私有大模型知识库

最近一段时间搭建了一套完整的私有大模型知识库,目前完整的服务已经完成测试部署上线。基本之前的实践过程,从工程角度整理技术方案以及中间碰到的一些问题,方便后续对这个方向有需求的研发同学们。本文是搭建离线私有大模型知识库的一次完整实践,整理了主要的实现方案以及离线部署中碰到的一些问题,记录的版本还是一个初步验证版本,知识库的实践还需要对中间环节进行大量调优,目前存在大量的论文进行这方面的研究,个人也在持续进行多轮的迭代调优,后续会持续整理和分享中间碰到的有价值的内容,欢迎持续关注。

2024-07-03 15:27:12 1080

原创 基于微调技术打造自己的私有LLM大模型

ChatGPT 是“大力出奇迹”的典型代表,通过千亿级训练参数带来惊人的智能,但大模型并不完美,甚至一些在我们看来很简单的任务都完成不了,比如我们构建一个简单计算任务(如下):ChatGPT-4.0 错误回答如下:我们必须明白,尽管 AI 在一定程度上模仿了人脑的工作方式,但实际上,机器人和人脑在处理信息时采用的策略有很大的不同。因此,即使在未来,我们也需要继续改进 AI 框架,以解决这种差距。

2024-07-03 15:22:36 756

原创 通用大模型时代终结?私有化专业大模型才是未来主角

人工智能技术发展迅速,ChatGPT已经成为历史上增长最快的在线服务。谷歌和微软正在将人工智能集成到他们的产品中,世界各国也都在争先恐后地将人工智能作为促进经济增长的新工具。随着人们进一步超越ChatGPT和Bard,我们可能会看到人工智能聊天机器人变得不再通用,而是更加专业化。由于人工智能会受到数据的限制——在这种情况下,为了让人工智能在工作中做得更好,数据变得格外重要。人工智能系统会吸收成千上万的数据。

2024-07-03 15:20:41 869

原创 详解AI产品经理工作全流程

需求定义主要要定义清楚以下几点:1、做什么?2、为什么要做,有什么收益和价值?3、业务预期目标、上线期限?为了方便理解,我们以开发一套筛选薅羊毛用户的产品进行举例说明。1、项目背景团队发现负责的项目数据统计有些异常,细查之后,发现存在夜间偷数据的情况,大致行为路径如下:淘宝上买一批手机号,注册新账号。通过自动薅羊毛的方式(新手礼包、每日签到、周任务等),获取免费券等资源。夜深人静的时候,使用免费券或积分批量下载数据。亡羊补牢,犹未晚矣。我们决定开发一套筛选薅羊毛用户的产品,彻底堵住这个缺口。

2024-06-30 22:28:47 699

原创 一图胜千言!机器学习模型可视化!!

机器学习可视化(简称ML可视化)一般是指通过图形或交互方式表示机器学习模型、数据及其关系的过程。目标是使理解模型的复杂算法和数据模式更容易,使技术和非技术利益相关者更容易理解它。

2024-06-29 22:51:32 1056

原创 通透!机器学习各大模型原理的深度剖析!

通俗来说,机器学习模型就是一种数学函数,它能够将输入数据映射到预测输出。更具体地说,机器学习模型就是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数。机器学习中的模型有很多种,例如逻辑回归模型、决策树模型、支持向量机模型等,每一种模型都有其适用的数据类型和问题类型。同时,以联结主义的感知机为例,通过增加感知机的隐藏层数,我们可以将其转化为深度神经网络。而对感知机加入核函数就可以转化为SVM。这一过程可以直观地展示了不同模型之间的内在联系,以及模型间的转化可能。

2024-06-29 22:48:10 613

原创 最强总结!18个机器学习核心算法模型!!

大家好~在学习机器学习之后,你认为最重要的算法模型有哪些?今儿的内容涉及到~线性回归逻辑回归决策树支持向量机朴素贝叶斯K近邻算法聚类算法神经网络集成方法降维算法主成分分析支持向量回归核方法最近邻算法随机森林梯度提升AdaBoost深度学习我把每种算法模型的核心公式和代码也列举了出来,如果有其他比较重要的算法,大家可以在评论区给出~这20种算法模型,大家可以作为复习,补充对于整个算法的框架。好了,咱们下面对每种算法进行介绍~

2024-06-29 22:42:34 1056

原创 什么是LLM?了解AI大型语言模型

随着大型语言模型(LLM)的兴起,我们正步入一个由AI驱动的沟通新时代。这些模型的进步不仅预示着技术创新的新浪潮,也为社会发展开辟了前所未有的道路。然而,随着LLM的能力日益增强,如何确保它们在负责任和伦理的框架内被运用,亦成为了我们必须面对的挑战。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-06-29 22:39:37 761

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除