Python程序员罗宾-CSDN博客

原创本地大语言模型部署

总体而言，现在大模型的确还存在着这样或那样的一些问题，但是谁又能说，现在的大模型不是爱迪生发明的第一盏电灯呢，虽然有着各种的不足，但是这指明的是未来的方向。

2024-07-22 19:56:22 104

本文深入探讨了大模型训练数据的重要性、类型及其在训练过程中的作用，特别强调了高质量数据对模型性能的关键影响。从模型训练所需的基本数据类型入手，区分了训练大语言模型和多模态模型所需的具体数据，并澄清了一些常见的误解，例如大模型训练并不依赖于用户个人信息。随后，着重论述了高质量数据的标准和重要性，包括数据的准确性、多样性和真实性对模型性能的直接影响。文章还介绍了合成数据作为一种解决训练数据供给不足的新方案，讨论了其定义、生成方法、分类及其在模型训练中的作用，尤其是如何通过合成数据提升模型的泛化能力和安全可靠性。

2024-07-22 19:52:43 465

原创《大模型训练数据白皮书》学习笔记

2024年5月24日，阿里研究院发布了《大模型训练数据白皮书》。有基础知识的科普，也有一些有趣的观点，摘录分享一下。模型训练阶段第一阶段预训练（Pre-training），，通过大量学习世界知识，构建模型的基础能力，理解客观世界的规律，该阶段的语料特征可以概括为“第二阶段监督微调（SFT），，通过标注人员设计问答，编写正确答案，将例题投喂给模型，并希望模型在没有见过的任务中“举一反三”，提升泛化能力。第三阶段基于人类反馈的强化学习（RLHF），

2024-07-22 19:51:08 252

原创大模型所谓的参数是什么？大模型为什么需要训练？大模型训练到底干了什么？

大模型的本质是机器学习，机器学习的本质就是一种数学模型。我们经常能听到这样的说法，某某大模型有多少参数，某某大模型参数量又提升了，这里所说的参数到底是什么？我们知道大模型是训练出来的，那么哪些训练数据都跑哪去了，大模型训练的过程中都干了什么？为什么大模型需要训练？‍‍01大模型的参数到底是什么？我们知道大模型的发展从刚开始的几百个参数，到现在的上千亿个参数，比如GPT-3就有一千七百多亿个参数。

2024-07-18 19:42:34 1015

原创大模型LLM微调技术方法paper汇总！

随着AI技术的发展，大型预训练模型在图像识别、自然语言处理等领域表现出色，不过为了使其适应特定的任务和数据集，这些模型通常需要针对特定应用进行微调。今天就特意整理了12篇大模型LLM微调技术方法paper分享给大家，提供了对于LLM在不同场景下进行高效微调的深入分析、实践经验和技术突破，大家可以学习一下！

2024-07-18 19:41:44 931

原创大模型微调（Tuning）的常见方法

大模型微调如上文所述有很多方法，并且对于每种方法都会有不同的微调流程、方式、准备工作和周期。

2024-07-18 19:41:07 758

原创初识大模型---大模型基础知识科普

大模型的定义大模型是指具有数千万甚至数亿参数的深度学习模型。近年来，随着计算机技术和大数据的快速发展，深度学习在各个领域取得了显著的成果，如自然语言处理，图片生成，工业数字化等。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。大模型的基本原理与特点大模型的原理是基于深度学习，它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数，使得模型能够在各种任务中取得最佳表现。

2024-07-17 22:01:42 799

原创微软最强小模型：打败大模型，你只需要“教科书“

我们推出了phi-1，这是一款全新的大型代码语言模型，其规模显著小于市面上的其他竞品模型。phi-1是一款基于Transformer的模型，拥有13亿个参数。它利用8个A100 GPU，在仅4天的时间内完成了训练。训练数据包括从网络上精选的“教科书级质量”的数据（60亿个词元）以及通过GPT-3.5生成的合成教科书和练习题（10亿个词元）。尽管phi-1的规模相对较小，但它在HumanEval基准测试中达到了50.6%的pass@1准确率，在MBPP基准测试中达到了55.5%的准确率。

2024-07-17 22:00:06 886

原创无意间发现一本书把构建大语言模型LLM应用一次性讲清楚了！

Building LLM Apps》这本书是一份，它不仅介绍了大型语言模型（LLM）的基础知识和前沿技术，还深入探讨了如何将这些模型应用到实际的AI应用中。书中从对LLM的深入介绍入手，接着探讨了，分析了它们的优缺点及适用场景。本书的重点之一是。作者通过详细的案例，指导你，这些代理能够从非结构化数据中检索信息，并与结构化数据进行交互。此外，书中还介绍了大型基础模型（LFMs），这些模型在的基础上，还能处理。

2024-07-17 21:52:25 713

原创使用ollama搭建自己的本地中文大语言模型

说到ai,大家应该不陌生了，它应该是目前最火的研究方向之一了，下面是目前比较流行的一些ai(人工智能大模型):openai的chatgptgoogle的GemmaAnthropic的Claude月之暗面的kimi阿里的通义千问百度的文心一言字节跳动的豆包但今天聊的是ollama这个开源框架加上开源模型来实现自己本地的ai。

2024-07-16 14:18:23 1030

原创大语言模型的微调策略

适应性强：全面微调能使模型充分适应特定任务，性能提升显著。应用广泛：适用于数据量大、计算资源充足的场景。

2024-07-16 14:16:27 408

原创大语言模型在金融领域的应用:进展、前景与挑战

2.1 GPT系列及其金融变体2.1.1 GPT系列简介。

2024-07-16 13:55:14 1152

原创部署自己的大语言模型的 5 种方法

【导语】从零开始构建一个新的大语言模型（LLM）可能会花费公司数百万甚至上亿的成本。但有几种方法可以部署定制的 LLM，它们更快、更简单，更重要的是，成本更低。这是历史上发展最快的新技术。生成式人工智能正在改变世界，改变我们创建图像、视频、音频、文本和代码的方式。根据戴尔公司 9 月份对 IT 决策者进行的一项调查，76% 的人表示，生成式人工智能将对他们的组织产生 “重大（如果不是变革性的）”影响，而且大多数人预计将在未来 12 个月内看到有意义的成果。大语言模型（LLM）是生成式人工智能的一种。

2024-07-16 13:53:11 560

原创企业怎么才能用上大语言模型？

客观来看，目前国内哪怕最先开始尝试应用大语言模型的先锋企业，现在仍然还在比较前期、研究怎么将企业数据、经营流程与大语言模型技术进行契合的阶段。针对大语言模型技术在具体业务场景中的应用范式，国内的很多云服务商和创业公司仍在持续技术创新的过程中。但先行起跑、在行业中抢先推行技术变革、做好数据收集和准备，必然能在将来大语言模型最终落地时，获得先手优势。

2024-07-16 13:50:17 839

原创人工智能时代，大模型的应用前景如何？

大模型是指具有大规模参数和复杂计算结构的机器学习模型。以下是大模型的相关介绍，按照分点表示和归纳进行整理：定义与特点：大模型由深度神经网络构建，拥有数十亿甚至数千亿个参数。设计目的是提高模型的表达能力和预测性能，能够处理更复杂的任务和数据。相比于小模型，大模型具有更强的表达能力、更好的性能，但也需要更高的计算资源和更长的训练时间。应用领域：自然语言处理（NLP）：如文本分类、情感分析、问答系统、机器翻译、文本生成等。计算机视觉（CV）：包括图像分类、目标检测、图像生成等。

2024-07-11 16:20:53 731

原创大模型在油气行业的落地实践应用

聊天小达人ChatGPT的出现，引爆了整个科技行业乃至人类社会，被誉为新一代的工业革命，也让背后的大模型技术被大家熟知。那么，什么是“大模型”呢？“大模型”就是大型语言模型的简称，一个技术名词。WIKI百科对大语言模型是这样解释的：大语言模型（英语：large language model, LLM）是一种语言模型，由具有许多参数（通常数十亿个权重或更多）的神经网络组成，使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在 2018 年左右出现，并在各种任务中表现出色。

2024-07-11 16:18:06 1154

原创大模型在研发运营领域的应用

大模型在研发运营领域的应用正日益广泛，它们通过人工智能技术显著提升了研发效率和运营流程的智能化。这些应用包括辅助编程，自动化测试，需求分析与管理，设计文档生成，知识管理，研发流程优化，个性化推荐，多语言支持，以及模型训练与优化。此外，大模型还有助于安全性和隐私保护，在跨领域应用中展现出其通用性。特别是在电信运营商领域，大模型的应用已经扩展到网络流量分析、故障预测和资源优化，大幅提升了网络运营的效率。随着技术的不断进步，大模型在研发运营领域的应用将更加深入，推动企业实现智能化转型。

2024-07-11 16:13:10 1134

原创大模型LLM在数据领域应用的探索

随着以ChatGPT为代表的智能问答机器人的横空出世，大模型在各个行业和业务场景下的应用需求也随即爆发。大模型成为企业数据体系中不可或缺的一部分，为企业数字化、智能化的发展提供良好的机遇和动力。本文从以下四个方面介绍大模型在数据领域应用的思路：利用Embedding优化语义检索搭建领域知识库，提供私域问答Text2SQL代码生成，结果可视化数据集探索性数据分析EDA。

2024-07-08 22:05:04 793

原创大模型应用落地那些事

之前的其他算法比如贪心算法，波束算法等效果不佳，openai 在 gpt2 中使用问题和 top-k 获得了更好效果。仅仅是目前的一个工程实践。

2024-07-08 22:04:31 760

原创货运大模型的未来：轻量化、场景化

大模型是一场技术创新与应用落地的双重赛跑，前者考验技术先进性，后者考验产品落地和应用性。对当下正处于激烈竞争的大模型厂商来说，把领先的技术，融于复杂的业务，最终融汇出简单好用、能落地到具体业务场景中的产品，才是关键。在应用之战中，能否轻量化、场景化，决定了大模型们对各行各业的革新进程与深度。

2024-07-08 22:03:34 1044

原创大语言模型应用指南：智能的可计算性

在人工智能的黄金时代，大语言模型已经成为了研究和应用的热点。它们不仅在自然语言处理领域取得了显著的成就，而且在知识提取、自动编程、数据分析等多个领域展现出了巨大的潜力。本文将深入探讨大语言模型的核心原理、应用实践以及未来的发展方向。大语言模型通常基于Transformer架构，利用自注意力机制捕捉文本中的长距离依赖关系。Transformer模型通过多头自注意力机制来并行处理输入序列，从而提高了模型的训练效率和性能。在本章节中，我们通过一个具体的项目实例，详细介绍了大语言模型的开发过程。

2024-07-03 15:47:32 1129

原创我们需要怎样的大模型？

技术的发展离不开用户的需求，大模型的成功离不开用户的选择。百度在大模型技术的发展过程中始终以用户体验为重，不断优化速度、效果和安全性，为用户提供更好的服务。在AI时代，技术服务于时代，大模型的发展将继续推动AI技术向更广泛、更深入的方向发展。读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用如果你是零基础小白，想快速入门大模型是可以考虑的。一方面是学习时间相对较短，学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2024-07-03 15:45:08 842

原创工业AI大模型落地应用的最新实践，都在这里

5月中旬，OpenAI推出最新大模型GPT-4o，不仅免费，能力更横跨听、看、说，丝滑流畅毫无延迟，甚至GPT-4o的节奏、语气甚至接梗，与真人无异。GPT-4o与人类形成多模态的深度配合和自然交互，大大颠覆人们对传统AI助手的想象。一天之后，谷歌开发者大会携新版Gemini AI大模型等尖端产品重装上阵，推出从新的搜索和聊天功能到面向云客户的AI硬件等十余种新品和升级产品，正面对决OpenAI。伴随技术不断升级，AI大模型的多行业、多场景应用也正日益广泛。

2024-07-03 15:42:53 545

原创揭秘大模型使用技巧：让AI助你一臂之力

在数字化时代，大模型技术如雨后春笋般蓬勃发展，为各行各业带来了前所未有的变革。然而，如何高效、精准地运用大模型，却是一门需要深入研究的学问。本文将为您揭秘大模型的使用技巧，助您在人工智能的浪潮中乘风破浪，轻松驾驭AI这一得力助手。一、了解大模型的基本原理大模型，顾名思义，是指具有庞大参数和复杂结构的深度学习模型。它通过海量数据的训练，能够学习到丰富的知识和模式，进而在各种应用场景中展现出强大的能力。要想充分发挥大模型的潜力，首先需要对其基本原理有一个清晰的认识。二、选择合适的大模型。

2024-07-03 15:41:13 368

原创企业在落地大模型应用中的数据分析难题及解决方案

随着人工智能技术的不断发展，大模型应用已经成为许多企业提升业务能力的重要手段。然而，在实际应用中，很多企业都面临着生成结果准确率较低的问题，尤其是在数据分析场景中。这一问题困扰着许多大模型项目负责人，严重影响了大模型的实际价值。大模型数据分析主要依赖于语言交互方式，这种方式虽然灵活，但也带来了理解问题和生成结果的巨大挑战。由于用户提问方式无法限制，大模型需要具备高度的语言理解能力来处理各种复杂的查询，导致生成结果的准确率偏低。示例1：含义清晰的单任务问题用户提问：“最近7天xx产品的订单总量是多少？

2024-07-03 15:40:02 523

原创大模型应用下自动驾驶赛道将有哪些变化

大模型的发展对云端和车端算力、感知端、执行端以及商业模式都产生了深远影响。BEV+Transformer技术通过整合多模态数据，提供全局视角，消除遮挡和重叠问题，从而提高物体检测和跟踪的精度。这种技术还通过注意力机制增强了智能驾驶的泛化能力，促使智能驾驶从机械式学习向总结归纳转变。在车端，大模型可赋能自动驾驶的感知和预测环节，并逐渐向决策层渗透，驾驶策略或将从规则驱动向数据驱动转变。在云端，大模型通过实现自动标、数据挖掘、仿真场景生成，提高自动驾驶迭代效率和速度。

2024-07-03 15:38:24 903

原创金融大模型应用的机遇与挑战

大模型通常指大语言模型（Large Language Model， LLM），是基于深度学习算法的自然语言处理技术，是通用大模型。大模型也在从单一自然语言处理模态向语音、图像等多模态大模型演进。目前国内外推出了众多的大模型，国内就不下上百款，也因此被称为“百模大战”或“千模大战”。但很多所谓的“大模型”仅是叫“大模型”而已，不管参数量多少，都不能称为真正的大模型。参数量是大模型的一个特征，但不是本质特征。

2024-07-03 15:36:24 1060

原创大概是最全的开源大模型LLM盘点了吧！

LLM(Large Language Model, 大型语言模型)是指那些规模庞大、参数数量众多的深度神经网络模型，用于理解和生成自然语言文本。在自然语言处理（NLP）领域有着广泛的应用，因其强大的语言理解和生成能力，能够处理各种复杂的文本任务，包括但不限于翻译、问答、文本摘要、对话、文本分类、情感分析、代码生成、创作辅助等。LLM主要基于Transformer架构，该架构由Vaswani等人在2017年的论文《Attention is All You Need》中提出。

2024-06-29 23:28:13 1087

原创 AI产品经理必备：什么是LLM,有什么优劣势

LLM（Large Language Model大型语言模型）是一种人工智能技术，能够理解和生成自然语言文本。LLM可以应用于多种场景，包括自然语言理解、文本生成、机器翻译、对话系统、问答系统、文本摘要、情感分析等。可以帮助人们快速生成文章、回复邮件、翻译文本、进行智能对话等。大模型的发展通常可以分为三个阶段：探索阶段、成熟阶段和普及阶段。每个阶段都有其特点和里程碑。特点：在这个阶段，大模型的概念和技术还在初步探索中。研究人员和机构开始尝试构建较大的神经网络，并探索其潜在的应用。

2024-06-29 23:26:55 1018

原创什么是LLM？看这一篇就够了！

自从2022年12月 ChatGPT 横空面世以来，AI 领域获得了十足的关注和资本，其实AI的概念在早些年也火过一波，本轮 AI 热潮相比于之前的 AI，最大的区别在于：生成式。本文主要介绍大语言模型（Large Language Model，简称LLM）。通过海量文本训练的、能识别人类语言、执行语言类任务、拥有大量参数的模型，称之为大语言模型。

2024-06-29 23:24:29 979

原创大语言模型 (LLM)是什么?

2023年，让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型（Large Language Model）”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处，能够结合上下文，像人一样有逻辑性地回答问题，就算生成超长的文本也不会跑偏。是一种机器学习算法，它可以根据给定文本来预测下一个词语或字符的出现的概率，通过大量的文本数据来学习语言的统计特征，进而生成具有相似统计特征的新文本。

2024-06-29 23:22:22 922

原创 AI产品经理 | 入行AI的必备知识

AI大模型从前年11月开始到现如今，非常火热，无论大厂还是创业新星都在为AI的落地搭建产品架构，并迅速跟进落地铺量，随着业务扩建，市面上也涌现出大量的大模型产品岗位。对于目前在看机会的如果想要入AI坑的话，产品经理要开始做哪些方面的准备工作呢？选择AI大模型的岗位本身也是在做职业的规划过程，对线上已有的公司提供的能力进行摸底调研有助于找准自己的兴趣点，并基于后续规划选择最为契合的岗位方向。按照产品服务的类型，市面上AI提供的品类主要有。

2024-06-25 14:41:12 737

原创 AI产品经理必须知道的技术之 RAG

在对用户问题进行Embedding前，对问题进行补充完善。避免用户问题太过简单、或者有明显错误。也可以考虑将用户问题，进行主题关键词抽取，或者使用知识图谱等进行初步的信息识别。这么做的目的是，避免用户的问题，信息太多太杂，导致检索出来的相关文档，与用户提问意图关联不大。也就是对用户问题进行简化。在检索文档时，可以增加一些过滤条件，例如指定章节、关键词包含、日期筛选、相似度阈值等，以使检索出来的内容更准确。对检索结果，也可考虑将相似度，与文档自身的权重进行综合加权。使提供给大模型的内容资料是最优的。

2024-06-25 14:32:14 717

原创 AI产品经理：方法、技术与实战

AI工程应用主要介绍云原生的AI应用。（6）从图灵测试的角度看，计算机只有具备了感知理解和交流能力（自然语言处理）、在存储交流中获得信息的能力（知识表示）、运用已知的信息回答和交流的能力（自动推理）、学习和适应新情况和模式的能力（机器学习），才能认为它可能是智能的。如果计算机还需要进行物理交互，则还需要具备观察的能力（计算机视觉）、反应和行动的能力（机器人学）等。(7)

2024-06-25 14:17:01 620

原创 AI产品从概念到市场的阶段

01在本节中，我们来了解新产品开发周期的各个阶段，因为无论是传统的功能产品，还是AI/ML产品，通常来说都会经历这些步骤，从而实现从构思到第一个可接受版本的推出。步骤1 - 发现(Discovery): 这是产品开发的起始阶段，主要关注于市场和用户需求的发现。产品经理需要进行市场研究、用户访谈和数据分析，以识别潜在的市场机会。步骤2 - 定义(Define): 在这一阶段，产品经理需要明确产品的目标、核心功能和用户故事。这包括制定清晰的产品愿景和目标，并定义成功的关键指标。

2024-06-25 14:13:05 690

原创人工智能大模型发展八大趋势与行业应用案例

随着科技的不断发展，人工智能已经成为了当今世界的热门话题之一。在这个领域，研究和发展的趋势也在不断变化。强化学习是人工智能领域的一个重要分支，它通过智能体与环境的交互学习来实现目标。近年来，随着深度学习技术的不断进步，强化学习取得了许多突破，成为人工智能研究的热点之一。自然语言处理是人工智能领域的重要应用之一，它涉及到语音识别、语义理解、机器翻译等多个方面。随着深度学习技术的应用，自然语言处理的效果得到了显著提升，未来将会有更多的突破和创新。

2024-06-23 13:00:00 906

原创大语言模型怎么写好提示词，看这篇就够了

对于任何输入，大语言模型都会给出相应的输出，这些输入都可以成为提示词，通常，提示词由指令和输入数据组成，指令是任务，输入数据是完成的要求，其中指令应该明确，用词不能模棱两可，并可以提供清晰、详细的上下文内容，提供的内容越精确，模型的生成效果也会越好。对于复杂的任务，通过增加背景提示、让大模型扮演角色身份，给定示例，以及输出要求，都可以提高输出的效果。其中，背景提示可以是事件的背景，如我正在写一份调研报告，输入任务背景有助于让模型生成符合我们期望的答案；

2024-06-23 12:30:00 961

原创 10分钟学会大模型提示词（更会用大模型）

目前大模型已经是一个趋势，有句话说“不是AI淘汰你，而是懂得用AI的人会淘汰你”，虽然说得有点夸张，但也表达出了会用AI是今后职场生存的必备之技能。下面是我参考了Open AI提示词指南之后总结的七个提示词要点，阅读完大约需要10分钟，但相信在你读完之后，可以学会更加有效地与大模型沟通。提示词工程之所以有效，背后的原理是由大模型的训练方式决定的，特定格式的提示词可以让模型工作得更好，产生更加有用的输出。效果较差的写法❌：用列表的形式总结以下文字的重要观点。

2024-06-23 12:00:00 864

原创大语言模型提示工程：综述

23年10月论文“Unleashing the potential of prompt engineering in Large Language Models: a comprehensive review“，来自北师范大学-香港浸会大学联合国际学院和北师大。本文深入探讨了提示工程在释放大语言模型（LLM）功能方面的关键作用。提示工程是构建LLM输入文本的过程，是优化LLM功效的一项不可或缺的技术。这项调查阐述了提示工程的基本原理，如角色提示、单提示和少量提示，以及更先进的方法，如思维链和思维树提示。

2024-06-22 13:00:00 720

原创生成式AI大模型之提示词工程实践

提示工程是一个新兴的领域，专注于开发、设计和优化提示，以增强 LLM 的输出，从而满足您的需求。它为您提供了一种引导模型的行为从而达到您想要实现的结果的方法。提示工程与微调不同。在微调中，使用训练数据调整权重或参数，目标是优化成本函数。就计算时间和实际成本而言，微调可能是一个昂贵的过程。然而，提示工程试图引导经过训练的 FM、LLM 或文本到图像模型给出更相关、更准确的答案。提示工程是充分发挥大语言模型的强大能力的最快方法。

2024-06-22 12:30:00 1743

空空如也

空空如也