自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(512)
  • 收藏
  • 关注

原创 基于AI大模型的数据治理

大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。大模型的原理是基于深度学习,它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数,使得模型能够在各种任务中取得最佳表现。

2024-07-12 17:11:19 1201

原创 大模型的模型压缩与有效推理综述

本文对大型语言模型的压缩和效率推理进行了综述。大型语言模型基于Transformer架构,具有强大的性能,但也带来了巨大的内存和计算成本。本文从算法角度对大型语言模型的压缩和效率推理方法进行了分类,包括量化、剪枝、知识蒸馏、紧凑架构设计和动态网络。大型语言模型有两个显著特点:(1)大多数压缩算法需要在压缩后对模型进行微调和甚至重新训练,而大型模型的微调和训练成本非常高。因此,许多算法,如量化和剪枝,开始探索免调优算法。(2)大型模型强调通用性和泛化能力,而非单一任务的性能。

2024-07-12 17:07:09 606

原创 25岁的Java工程师,6个月顺利转行人工智能

曾经我是一名Java开发者,在过去的日子里,经历了夜以继日的加班、浑浑噩噩的摆烂。如今,作为一名从博学谷毕业的人工智能从业者,职业生涯再度焕发活力,生活也变得非常愉快。接下来,我将转变前后的这段经历分享给大家。很早之前,我在一家小公司担任Java开发人员,每天忙于增删改查。虽然收入不高,但公司氛围不错,福利也还可以,我原以为这样的生活会一直延续下去。然而,2022年底,当时我拿着经过模型调整后的代码,进行code review(代码审查)时,竟获得了一致好评。

2024-07-11 14:47:13 502

原创 29岁程序员逆袭记:从负债累累到月入130万的AI创业之路

Jozef 的成功,证明了现在确实是创业的黄金时代,特别是在 AI 领域。他用自己的经历告诉我们:“创办一家价值数百万美元的公司从未如此容易。机会无处不在,成本低得可笑。不要错过这个机会!从他身上我们可以得到几点启发:1.现在是创办在线业务的最佳时机,特别是在 AI 领域。开发工具、教程和初期托管都是免费的。2.你不需要融资就能创办公司。Jozef 只用了 250 美元就开始了他的创业之旅。3.如果产品失败,要么是产品本身有问题,要么是市场不合适。要学会快速调整。所以,各位国内的码农,还在等什么。

2024-07-11 14:39:53 981

原创 35岁程序员,想转行大模型,我应该怎么做?

1. 基础知识学习:首先,你需要掌握一些基础知识,如机器学习、深度学习、神经网络等。可以通过在线课程、书籍、研讨会等方式进行学习。例如,你可以学习TensorFlow、PyTorch等深度学习框架。2. 实践操作:理论知识学习后,通过实际操作来加深理解。你可以尝试自己实现一些简单的模型,或者在Kaggle等平台上参加数据科学竞赛,通过实际项目来提升自己的技能。3. 关注行业动态:了解大模型领域的最新研究动态和应用场景。

2024-07-11 14:16:16 937

原创 大模型LLM,微调经验分享全面总结

大型语言模型横行,之前非常焦虑,现在全面拥抱。目前也有很多开源项目进行大模型微调等,笔者也做了一阵子大模型了,特此来介绍一下ChatGLM-6B模型微调经验,并汇总了一下目前开源项目&数据。笔者与很多人微调结论不同,本人在采用单指令上进行模型微调,发现模型微调之后,

2024-07-08 21:50:10 694

原创 一文详解大模型微调常用方法

最近,深度学习的研究中出现了许多大型预训练模型,例如 GPT-3、ChatGPT、GPT4、ChatGLM-130B 等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT 模型因为在对话生成方面的表现而备受瞩目,成为了自然语言处理领域的热门研究方向。然而,这些大型预训练模型的训练成本非常高昂,需要庞大的计算资源和大量的数据,一般人难以承受。这也导致了一些研究人员难以重复和验证先前的研究成果。

2024-07-08 21:46:06 896

原创 大模型LLM的三种微调方法的经验分享&总结

PT方法占用显存更大,因为也增加了很多而外参数;测试耗时,采用float16进行模型推理,由于其他方法均增加了额外参数,因此其他方法的推理耗时会比Freeze方法要高。当然由于是生成模型,所以生成的长度也会影响耗时;模型在指定任务上微调之后,并没有丧失原有能力,例如生成“帮我写个快排算法”,依然可以生成-快排代码;

2024-07-08 21:43:34 820

原创 基于大模型构建企业私有智能知识库落地的简单实践

随着人工智能技术的飞速发展,大模型在企业知识管理中的应用日益广泛。下文是作者围绕如何基于大模型技术构建企业私有知识库,以提升企业的知识管理效率和创新能力的一些思考和简单实践。本文对企业知识库的落地场景暂不作广泛的展开,主要记录作者基于大模型构建企业私有知识库的一些技术实践。

2024-07-03 19:30:00 692

原创 私域大模型应用介绍

私域大模型是近年来在数字政府和私域运营领域兴起的一种重要概念和实践。它代表了基于特定领域或地域需求,通过深度定制和垂直化应用,打造的高效能AI模型。这种模型不仅体现了对数据和技术的深度应用,还反映了对于特定行业或区域特定需求的精准把握。像ChatGPT这样的公共大模型,使用互联网规模的公开领域通用数据进行训练,但是它无法读取到企业内部的数据和知识,因此无法处理企业内部的任务。另外,企业或其他组织也不希望某些内部信息发送到公有云,而是希望这些信息仅保留在本企业或组织中。于是私域大模型就应运而生了。

2024-07-03 15:17:07 933

原创 揭秘大模型落地:从内核到应用场景的超级挑战!

你是否曾经想过,那些让我们惊叹不已的大模型,是如何从冰冷的代码变成我们生活中不可或缺的一部分的呢?今天,就让我们一起揭开大模型落地的神秘面纱,看看这背后究竟隐藏着怎样的复杂与挑战!首先,让我们来聊聊大模型落地的目标用户——那就是追求科技创新、期待改变世界的你我他。在数字化时代,我们都在追求更智能、更便捷的生活体验,而大模型正是实现这一目标的关键。但是,你知道大模型的落地过程中,究竟会遇到哪些难题吗?大模型的落地,堪称一项复杂艰巨且极具挑战性的浩大工程。

2024-07-03 15:04:52 379

原创 我们公司落地大模型的路径、方法和坑

假设我们正在构建一个 RAG 系统来生成 SQL 查询。我们可以简单地提供表模式和列名作为上下文。但是,如果我们包括列描述和一些代表性值呢?额外的细节可以帮助 LLM 更好地理解表的语义,从而生成更正确的 SQL。

2024-07-03 15:02:33 651

原创 大模型应用元年,到底有哪些场景可以实际落地?

很多企业和个人都号称自己打造了AI大模型实际落地场景,其中有噱头、蹭热点,也有真实落地应用的。下面我将聊聊有哪些应用是真实落地可执行的。

2024-07-03 14:57:44 1095

原创 AI大模型如何在企业内落地应用?

AI+”已成为继“软件+”“互联网+”之后,最重要的新质生产力,是今后十年内技术创新和产业升级的核心驱动力。AI大模型技术将重塑千行百业,如何尽快、尽好地将应用大模型技术创造新的核心能力和新的运营服务优势,是所有企业共同面对的机遇和挑战。就是要及时跟进建设自身的AI能力,要在大模型、大数据和大算力这三大要素上,让企业具备不同层次的能力(基础能力、强化能力和创新能力)。就是通过AI大模型技术的运用,全面赋能企业业务体系、运营管理和组织治理,打造新型核心竞争力,建立产品和服务的新优势。

2024-06-30 21:50:46 455

原创 AI大模型工业应用模式及其实现

人工智能是引领这一轮科技革命和产业变革的战略性技术,具有“头雁”效应,溢出带动性很强。通用人工智能大模型(以下简称“大模型”)作为人工智能从专用化迈向通用化的发展新阶段,是集智能感知、智能分析、智能决策、智能执行等功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。从生产结构来看,人工智能技术已成为现代工业生产的核心组成部分,能够大幅提高生产效率、优化资源配置、降低生产成本,为新型工业化发展提供强大的技术支持和动力。

2024-06-30 21:20:26 981

原创 LLM大模型测试策略与方法

DeepEval是一个用于对语言模型(LLM)应用进行评估和单元测试的框架。它提供了各种指标,可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。DeepEval使得机器学习工程师可以通过持续集成/持续交付(CI/CD)流程快速评估语言模型应用的性能。此前分享过一篇LLM评估指标的文章,这篇文章深入探讨如何使用指标进行LLM评估。

2024-06-29 22:36:35 619

原创 大语言模型(LLM)快速理解

从大语言模型字面意思来理解,“语言”和“模型”很好理解,就是代表着在自然语言处理上的AI模型。而这个大指的是神经网络很大,包括模型的参数数量训练数据量计算资源等。参数数量大语言模型通常含有数十亿到数千亿个参数,使得模型能够有更强的语言理解、推理和生成能力。2018年发布的GPT-1包含 1.17 亿个参数,9.85 亿个单词。``2019年发布的GPT-2包含15亿个参数。``2020年发布的GPT-3包含1750亿个参数。ChatGPT 就是基于这个模型。

2024-06-29 22:33:29 1088

原创 对国内外开源大模型(LLM)较为全面的整理

CodeFuse-13B 是基于 GPT-NeoX 框架训练的 13B 参数代码生成模型,能够处理 4096 个字符的代码序列。该模型在 1000B Token 的代码、中文、英文数据数据集上进行预训练,覆盖超过 40 种编程语言。为了进一步提升生成代码的效果和质量,该模型还在CodeFuse-Evol-instruction-66k 数据集上进行了微调,使得该模型能够生成更加准确、高效、符合要求的代码。

2024-06-29 22:32:00 721

原创 开源大型语言模型(llm)总结

大型语言模型在ChatGPT以后经历了快速的发展。这些发展包括模型规模的增加、领域专精化、语义理解和推理能力的提升、训练效率和速度的提高,以及对偏见的理解和应对等方面。

2024-06-29 22:04:09 971

原创 通过大型语言模型(LLM)的主动多药管理,加强老年人护理

导 读据世界卫生组织称,到 2050 年,60 岁以上人口将几乎增加一倍。人口老龄化增加了医疗系统的负担,其中老年人群的多药治疗(同时使用5种或5种以上药物)是一个重要挑战。多药治疗可能会增加药物不良作用的风险,因此有效的多药治疗管理至关重要。近期,有研究指出ChatGPT在辅助医生进行多药治疗管理方面具有潜力。1. 在是/否的二元减药决策中,ChatGPT普遍推荐减药,不考虑患者的日常生活活动状态,但在有心血管疾病史的患者中,ChatGPT的回答会发生变化。

2024-06-29 22:03:38 952

原创 如何从零开始训练一个LLM大模型

从零开始训练一个大型语言模型(LLM)是一个复杂且资源消耗巨大的过程,涉及多个步骤和阶段。

2024-06-29 22:03:08 869

原创 【新书】大语言模型手册:语言理解与生成,191页pdf

在过去的几年里,人工智能在语言能力方面取得了惊人的新进展。由深度学习的快速进步所推动,语言AI系统在编写和理解文本方面的能力比以往任何时候都要好。这一趋势促成了新功能、产品乃至整个行业的崛起。通过这本书,Python开发者将学习到使用这些能力所需的实用工具和概念。你将学习如何利用预训练的大型语言模型的力量,用于像文案写作和摘要等用例;创建超越关键词匹配的语义搜索系统;构建分类和聚类文本的系统,以实现对大量文本文档的可扩展理解;以及使用现有库和预训练模型进行文本分类、搜索和聚类。

2024-06-25 16:33:31 966

原创 大模型Agent智能体实操笔记,超干分享!

什么是大模型?大模型,即 Large Language Model(LLM),运用深度学习技术,凭借互联网海量数据训练,参数量级高达数十亿至数万亿。这使得大模型能学习复杂细节,具备强大问题解决能力,跨领域能力出色,涵盖自然语言处理、图像识别等,比如:GPT 系列展示的智能对话与文本生成。其“多模态”特性覆盖文本、语音、图片、视频等格式,但训练需巨大计算资源、时间和成本,通常由大公司承担,类似移动互联网中的操作系统。基础模型预训练后,针对特定任务还需微调以优化性能,该过程虽较预训练成本低,但仍具一定门槛。目前

2024-06-25 16:31:30 983

原创 大模型开发入门必读资料

随着 GPT 的爆红,“AI 大模型” 已成为技术圈最火的话题。华为、阿里、腾讯、字节等大厂纷纷加大对 AI 技术和市场的投资,许多 AI 创业公司也如雨后春笋般涌现。这些公司都在以高薪资争夺 AI 大模型人才。作为普通工程师,我们要及时抓住机会,才能享受 AI 技术带来的红利。要抓住这些机会,首先需要掌握扎实的技术。现在向大家推荐一本书:《大规模语言模型:从理论到实践》。这本书从理论到实战,带领读者一步步实现大模型,是你提升技能、迈向 AI 大模型领域的绝佳指南。

2024-06-25 16:28:23 629

原创 多模态大模型VLMs一年多的进展与思考

要想回答视觉是否能让LLM更智能,首先要定义什么是智能,以及智能怎么来的。在此简要概述笔者理解的“智能” (不一定对)。首先将“智能”狭义的定义为“连接关系”。例如,单独的“人”这个词仅仅是一个指代,只有当我们将“人”这一概念与“手”、“头”、“车”等其他概念连接起来时,它才具有实际的意义。在狭义上,智能可以被定义为将各种事物和概念“连接”在一起的能力。将智能的产生过程归纳如下:• 首先通过观测运动的物理世界,我们会发现一些简单的“连接关系”,比如手和头是连接在一起的,树上有小绿片等。

2024-06-24 17:05:04 712

原创 AI大模型,加速企业 “M型分化”

M型分化这一说法,其实是“套用”了日本学者大前研一提出的“M型社会”的概念。后者原本是指社会结构由传统的金字塔型向M型转变。在这种结构中,中产阶层不再是社会的主体,他们无法跃迁至上层,只能滑向社会的底层,和上层人群分占社会的两端。而所谓的企业“M型分化”,表达的也是类似的道理,大型企业和小型企业占据两端,而中型公司则面临被边缘化的风险。因此,这类企业未来面临的选择也非常清楚:要么通过整合资源、扩大规模变成平台;要么“瘦身减负”,成为具有独特竞争力的“新个体”。

2024-06-24 16:59:42 1003

原创 通过一个 AI 产品的落地,掌握产品经理工作全流程

对于任何一家互联网公司来说,用户流失都是我们必须要关注的一个问题。这篇文章,我就通过我一个预测用户流失的项目,带你了解一个 AI 产品从筹备到上线的全流程。从中,你可以体会到 AI 产品经理的完整工作流程是什么,每一个环节都有什么角色参与,每个角色需要做什么工作,他们的产出又都是什么。业务背景。

2024-06-23 13:00:00 1656

原创 AI产品经理的入门帖

2023年chatGPT的推出,引爆了人工智能相关产业的发展,千模大战,创业公司层面都或多或少带点AI的概念(噱头)。自2016年alpha GO后,沉寂几年的AI重新回到了大众视野中。根据麦肯锡的一个报告预估那些应用了AI的公司在2030时比2025年收益提升120%+。与AI相关的岗位也逐渐增多,AI产品经理作为其中1个大类也越来越热。最近看了一本《AI产品经理操作手册》,结合实际AI产品经理工作经验,。

2024-06-23 12:00:00 688

原创 读AI产品经理:方法、技术与实战

AI,其实是科学家理解和重构人类智能的产物,人们期待它像人一样理解和探索未知事物,进而发展生产力、延续人类文明。当前AI已形成三大学派,即符号主义、连接主义、行为主义。符号主义又称逻辑主义、心理学派或计算机学派。该学派认为AI源于数理逻辑,经过大半个世纪的发展,符号主义依然是AI的主流派别。连接主义又称仿生学派或生理学派,该学派认为AI源于仿生学,特别是对人脑模型的研究。连接主义通过研究脑模型和模拟神经元,构建人工神经网络模型,开辟出AI发展的另一种途径。

2024-06-23 11:00:00 627

原创 AI产品经理:角色的职责与挑战

01AI产品管理:从商业目标到技术交付的完整视角随着AI技术在各行各业的迅速应用,AI产品管理逐渐崭露头角。。每一个成功的产品都始于明确、具体的商业目标。AI产品经理的职责是确保AI产品的方向和组织的长期战略保持一致。这需要他们:定义产品的ROI和KPI。对市场和竞争对手进行深入研究。协同其他团队确保产品目标的实现。数据科学家在AI产品团队中起到核心作用。他们负责从大量数据中提取有价值的信息,为产品提供智能化的功能和服务。使用先进的算法和模型进行预测分析。

2024-06-22 13:00:00 770

原创 如何成为成功的AI产品经理

1 AI产品经理的角色和职责2 AI产品经理的必备知识技能3 案例分析4 总结一下随着ChatGPT的大热,也带动今年的AI火了一把,很多公司都开始进行相关部署,自然产生了很多岗位需求。来源:BOSS直聘那么,要想当AI产品经理,你该去了解什么,知道什么,我们今天讲下「」系列的第二节,,我们拆分几个方面,再加上一些案例分析,让大家更好地理解。可以回顾下,做PMS产品经理。01 AI产品经理的角色和职责。

2024-06-22 12:00:00 1025

原创 一文告诉你,做PMS产品经理你得懂什么

PMS,英文全称。

2024-06-22 11:00:00 1307

原创 AI产品经理,令人向往的工作

工作职责:1、负责研究AI大语言模型在电商多个业务场景的应用,制定应用层的产品策略和规划;2、了解通用大模型技术栈,对接技术研发团队,确保产品开发的技术可行性;3、对AI产品效果负责,持续进行问题诊断、数据分析、模型优化、培训与效果运营等工作;4、对行业发展及产品动态有充分的认知,并能够通过型持续的功能迭代和运营提升AI产品能力;任职资格:1、本科及以上学历(硕士优先),计算机科学/人工智能相关专业,8年以上产品经理工作经验,至少2年自然语言处理、强化学习、人工智能领域相关工作经验;

2024-06-21 15:15:11 727

原创 AI产品经理,到底要做什么?

在我们要做一个AI产品之前,不论处于“三层楼”基础层、技术层还是应用层, 都需要搞明白要解决什么问题?

2024-06-21 14:48:27 812

原创 AI产品经理有什么不一样

现在的AI能力不仅是大模型,还有NLP、OCR等AI技术,而AI产品就是指的是依靠这些技术来完成的产品基础底座,现在主流的AI产品以大模型为基础的产品,可以通过多个模型完成。AI agent就是AI产品,一个AI应用的最小单位。

2024-06-21 14:47:48 548

原创 直观易用的大模型开发框架LangChain,你会了没?

在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!LangChain 作为一个大语言模型(LLM)集成框架,旨在简化使用大语言模型的开发过程,包括如下组件:

2024-06-19 17:18:41 969

原创 大模型时代,如何快速开发AI应用

大模型快速普及应用的当下,AI浪潮汹涌而至,对于开发者来说,开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵,从数据处理、算法开发、模型训练到部署,全方位拆解AI开发全流程,今天这篇文章,将通过以下问题,带你上手华为云一站式AI开发平台ModelArts,实现AI应用的快速开发。

2024-06-19 17:17:57 701

原创 大模型之战,下半场是智能体?

让智能体人人可用。迈入2024年,大模型的竞赛终于翻开了新的一页。从卷文本长度,卷多模态,到开卷智能体,各家都在试图建立自己的潮流。有人掀起价格战,就有人踊跃跟战。但对于大模型赛道的未来而言,更关键的,是如何打造自身独一无二的特性,如何让技术创造真正的价值。5月30日,2024百度移动生态万象大会在苏州举办,会上百度再秀肌肉,发布百度搜索、文心一言App、百度文库、文心智能体平台等能力升级。

2024-06-19 17:17:14 1048

原创 大模型市场打响价格战,“应用爆发元年”要来了?

国内人工智能大模型市场正在经历一场价格战。字节跳动、阿里云、百度、腾讯、科大讯飞等公司纷纷加入战局,价格一降再降。有业内人士甚至开玩笑说,下一家跟进的厂商可能得倒贴钱来奖励客户用大模型了!这场价格战是迟早的事。2022年底,美国OpenAI公司的ChatGPT掀起人工智能大模型热潮,一年半以来,国内外大模型市场风起云涌。今年3月,国家数据局局长刘烈宏曾在一次论坛上透露,中国10亿参数规模以上的大模型数量已超过100个。GPU芯片的快速迭代让同样的计算量成本更低,模型优化则让同样的推理任务所需计算量更少。

2024-06-19 17:16:39 643

原创 大语言模型(LLMs)优势、挑战与私有化

大型语言模型(LLMs)展现出了巨大的商业潜力,这一点从ChatGPT的迅速普及中得到了明显体现。自发布以来,ChatGPT在短时间内便成为了增长最为迅猛的数字应用之一。LLMs已经在众多业务领域中得到了应用,并且随着这些技术在各个行业中的应用日益广泛,应用用例也在不断扩展和增加。随着时间的推移,我们可以预期LLMs将在更多的业务场景中发挥关键作用,推动创新和效率的提升。大语言模型的优势内容创作:LLMs是功能强大的生成式AI工具,可用于生成各种内容,包括文本、图像、视频和音频。通过微调过程中使用的数据,L

2024-06-19 10:37:41 696

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除