自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(80)
  • 收藏
  • 关注

原创 Sora到底是什么?Sora详解:一文带你熟悉Sora_sora介绍

基本概念自2015年成立以来,OpenAI已经成为人工智能研究与推广的领军机构。这家机构在深度学习、自然语言处理等多个前沿领域不断取得重大突破,引领着行业的发展潮流。特别是通过其GPT-4等先进模型的开发,OpenAI不仅巩固了自己在人工智能技术创新与应用开发方面的领导地位,更展现了其对AI技术安全和伦理发展的深切承诺。OpenAI致力于利用这些突破性技术造福全人类,为构建一个更智能、更安全的未来而努力。(PS:如果你需要开通ChatGPT-4.0的话,请查看:ChatGPT订阅、升级教程)2024

2024-08-08 14:47:16 1364

原创 大模型核心技术原理 Transformer架构详解

在大模型发展历程中,有两个比较重要点:第一,Transformer 架构。它是模型的底座,但 Transformer 不等于大模型,但大模型的架构可以基于 Transformer;第二,GPT。严格意义上讲,GPT 可能不算是一个模型,更像是一种预训练范式,它本身模型架构是基于 Transformer,但 GPT 引入了“预测下一个词”的任务,即不断通过前文内容预测下一个词。之后,在大量的数据上进行学习才达到大模型的效果。

2024-08-08 14:46:23 1043

原创 别焦虑,这份初学者入门大语言模型(LLM)教程学习路线给你做好了_如何让大模型学会语法

真的想入门大语言模型,只看这一个文章应该是可以入门的。但是修行下去,还是要靠自己的了!如果你把大语言模型/LLM 当成一门技术来看,那就要看一下这门技术需要什么。这些东西我们假定你都已经会了,或者熟练使用了。如果不熟,我建议你自己再学习一下。尤其是数学的几个基本公式,是要学会的。我列一下吧。

2024-08-08 14:45:50 904

原创 【人工智能LLM】开源 LLM 大模型汇总以及微调策略_有哪些开源的大模型可以微调(1)

自从ChatGPT出世以来,各个大厂/研究院都纷纷推出自己的大模型,大模型领域发展一日千里。随着“百模大战”热度的降低,有必要梳理一下目前主流的大模型以及其变种模型,为大家梳理一下当前开源模型的工作。

2024-08-06 10:36:01 1196

原创 大模型到底微调个啥?技术含量有多大?深度解析全面综述!_大模型微调

大型模型代表了多个应用领域的突破性进展,能够在各种任务中取得显著成就。然而,它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成,需要大量的计算资源才能执行。特别是,当为特定的下游任务定制它们时,特别是在受计算能力限制的硬件平台上,扩展的规模和计算需求带来了相当大的挑战。参数有效微调(PEFT)通过在各种下游任务中有效地调整大型模型,提供了一种实用的解决方案。特别是,PEFT是指调整预先训练的大型模型的参数,使其适应特定任务或领域,同时最小化引入的额外参数或所需计算资源的数量的过程。

2024-08-06 10:35:20 1085

原创 大模型到底能干啥,不能干啥?_大模型不能做到什么

举例:高精确度:中国的首都是哪里?北京。低精确度:请一句话赞美上海。上海,这座璀璨的东方之珠,以其独特的魅力、繁荣的经济和深厚的文化底蕴,展现了无与伦比的现代都市风采。特点:高精确度的结果一般是有正确参考答案的,像人的理性思考。低精确度的结果,一般没有正确回答,怎么回答都可以,像人的感性思考。

2024-08-06 10:34:31 795

原创 AI大模型入门基础教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!

AI大模型,简而言之,是基于深度学习技术的庞大规模数据与计算能力孕育出的智能模型。这些模型的特别之处在于它们不仅参数量级的庞大,常常跨越亿计,而且在处理复杂度上也远超乎想象。正是这种规模和复杂性,使得它们在诸如自然语言理解、图像识别、语音识别等领域展现出卓越的准确性和泛化的处理能力,几乎可比拟的泛化应用范围。

2024-07-29 14:37:35 687

原创 AI大模型变革职场:职场人迎来的双刃剑——惊喜与挑战并存

AI大模型的到来,就像是给职场带来了一场"惊喜派对虽然它带来了一些"惊吓",但更多的是惊喜和机遇。作为职场人,我们需要拥抱变化,不断提升自己,才能在这个派对中成为最耀眼的明星。记住,AI可以取代我们的工作,但它永远取代不了我们的智慧和幽默。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-07-29 14:36:40 262

原创 【微调大模型】如何利用开源大模型,微调出一个自己大模型_大模型训练和微调框架

最近对大模型这部分内容比较感兴趣,作者最早接触大模型是22年下半年的时候。当时觉得非常amazing,并认为这是一个颠覆性的工作,目前随着开源大模型的逐渐变多。我觉得我们得学习并了解这些基础知识,以便后续在工作中可以学习并使用。在深度学习中,微调是一种重要的技术,用于改进预训练模型的性能。除了微调ChatGPT之外,还有许多其他预训练模型可以进行微调。微调所有层:将预训练模型的所有层都参与微调,以适应新的任务。微调顶层:只微调预训练模型的顶层,以适应新的任务。冻结底层。

2024-07-29 14:35:58 427

原创 AI大模型的预训练、迁移和中间件编程_ai 中间件

OpenAI 在 2022 年 11月推出了人工智能聊天应用—ChatGPT。它具有广泛的应用场景,在多项专业和学术基准测试中表现出的智力水平,不仅接近甚至有时超越了人类的平均水平。这使得ChatGPT 在推出之初就受到广大用户的欢迎,被科技界誉为人工智能领域的新里程碑。人们在为生成式人工智能所带来的多模态内容创作效率的提升而欢呼时,常常低估ChatGPT的推理能力。

2024-07-26 15:26:21 426

原创 10分钟建立一个自媒体秘书——国产企业级大模型文心千帆初体验_文心大模型和文心千帆的区别

首先介绍一下文心千帆。文心千帆大模型平台是百度智能云推出的全球首个一站式企业级大模型平台,为企业提供大模型训练及推理的全流程工具链和整套环境,让企业以最简单最高效的方式用上大模型、用好大模型。在文心千帆上,企业不但可以直接调用文心一言服务,也可以开发、部署和调用自己的大模型服务,是企业拥抱大模型的最佳选择。与我们之前了解过的文心一言不同,文心千帆大模型平台是百度文心大模型的官方和唯一的商业化服务平台。对内及对外统一由文心千帆来提供服务,文心千帆从数据服务(生成、标注、回流)、模型训练(

2024-07-26 15:25:38 988

原创 【人工智能LLM】开源 LLM 大模型汇总以及微调策略_有哪些开源的大模型可以微调(1)

自从ChatGPT出世以来,各个大厂/研究院都纷纷推出自己的大模型,大模型领域发展一日千里。随着“百模大战”热度的降低,有必要梳理一下目前主流的大模型以及其变种模型,为大家梳理一下当前开源模型的工作。

2024-07-26 15:24:17 780

原创 多模态大模型入门指南(非常详细)零基础入门到精通,收藏这一篇就够了

内容总结,本篇综述主要介绍和分析了以下几个方面:• 概述了MM-LLMs的设计形式,将模型架构分为5个部分:模态编码器、输入投影器、语言模型骨干、输出投影器和模态生成器。阐述了每一部分的实现选择。• 描述了MM-LLMs的训练流程,主要包括多模态预训练和多模态指令微调两个阶段。• 总结分析了26种主流的MM-LLMs模型,从模型架构、训练数据集规模等多个维度进行了对比。• 综合回顾了主要MM-LLMs在18个广泛使用的视觉语言评测集上的表现,并总结提炼出提升模型效果的重要训练方法。

2024-07-24 14:24:08 930

原创 如何系统的入门大模型?

随着人工智能技术的飞速发展,大模型,尤其是在自然语言处理(NLP)领域的变革性影响,已经引起了广泛的关注。本文将详细介绍如何系统地入门和学习大模型,帮助初学者有效地掌握这一前沿技术。通过遵循以上步骤,你可以系统地入门和掌握大模型。此外,保持好奇心和持续学习的态度对于在AI领域取得成功至关重要。

2024-07-24 14:23:27 535

原创 大模型到底能干啥,不能干啥?_大模型不能做到什么

举例:高精确度:中国的首都是哪里?北京。低精确度:请一句话赞美上海。上海,这座璀璨的东方之珠,以其独特的魅力、繁荣的经济和深厚的文化底蕴,展现了无与伦比的现代都市风采。特点:高精确度的结果一般是有正确参考答案的,像人的理性思考。低精确度的结果,一般没有正确回答,怎么回答都可以,像人的感性思考。

2024-07-24 14:22:53 1404

原创 Llama 3无限使用!喂饭级本地部署教程,零成本爽翻天_llama3怎么喂数据

近日,真正的“OpenAI”——Meta公司,对“Close AI”进行了有力回应,推出了其开源大模型系列的最新力作——更是青出于蓝,不仅在技术层面实现了对的重大突破,还在各种评估测试中展现出令人瞩目的表现。这标志着AI技术又迈出了坚实的一步。目前,推出了两个版本,分别是8B和70B。在与同等级别的Gemma和Mistral开源模型较量中,8B版本展现出了显著的优势。至于70B版本,它在与Gemini Pro 1.5及Claude的Sonnet模型的比拼中,表现得旗鼓相当,难分伯仲。

2024-07-22 15:12:31 1139

原创 为什么说国产大模型的野心,都藏在 MaaS 的生态中

2016 年 4 月,在一场由 IDG 主办的行业峰会上。IDG 创始董事长熊晓鸽,刚刚盘点完 IDG 深耕中国企业服务多年的成果,台下,GE 中国公司 CEO 便发出了不合时宜的灵魂一问:「中国有很多伟大的公司,也有很多超级大的国企,但是为什么就是没有软件服务的 to B 巨头?热闹的会场,顿时一片沉默。那时,将原因归咎于「投资人不给力」的熊晓鸽大概也不会意识到,他反思自谦的 2016 年,已经是国产 SaaS 行业在一级市场最热闹的日子。

2024-07-22 15:11:47 844

原创 LLM大模型技术实战5:一文总结Prompt提示工程策略与技巧_llm prompt

由于 GPT 模型具有固定的上下文长度,它们无法在单个查询中概括比上下文长度减去生成摘要长度还要长的文本。要摘要像书籍这样的非常长文档,我们可以使用一系列查询逐部分摘要文档。部分摘要可以连接在一起生成摘要的摘要。该过程可以递归进行,直到整个文档被摘要。如果为了理解后面部分需要使用前面部分的信息,则可以在摘要某点内容时,将该点之前文本的运行摘要也包括在内,这一技巧也很有用。OpenAI 之前的研究已经研究了使用 GPT-3 变体递归摘要书籍的效果。

2024-07-22 15:10:51 655

原创 多模态大模型入门指南(非常详细)零基础入门到精通,收藏这一篇就够了

如表1所示,对26 SOTA MM-LLMs的架构和训练数据集规模进行了全面比较。随后,简要介绍这些模型的核心贡献并总结了它们的发展趋势。代表了一系列视觉语言 (VL) 模型,旨在处理交错的视觉数据和文本,生成自由格式的文本作为输出。(2)BLIP-2引入了一个资源效率更高的框架,包括用于弥补模态差距的轻量级 Q-Former ,实现对冻结 LLMs 的充分利用。利用 LLMs,BLIP-2 可以使用自然语言提示进行零样本图像到文本的生成。(3)LLaVA。

2024-07-18 10:43:58 998

原创 大模型到底能干啥,不能干啥?_大模型不能做到什么

举例:高精确度:中国的首都是哪里?北京。低精确度:请一句话赞美上海。上海,这座璀璨的东方之珠,以其独特的魅力、繁荣的经济和深厚的文化底蕴,展现了无与伦比的现代都市风采。特点:高精确度的结果一般是有正确参考答案的,像人的理性思考。低精确度的结果,一般没有正确回答,怎么回答都可以,像人的感性思考。

2024-07-18 10:43:11 893

原创 如何系统的入门大模型?

随着人工智能技术的飞速发展,大模型,尤其是在自然语言处理(NLP)领域的变革性影响,已经引起了广泛的关注。本文将详细介绍如何系统地入门和学习大模型,帮助初学者有效地掌握这一前沿技术。通过遵循以上步骤,你可以系统地入门和掌握大模型。此外,保持好奇心和持续学习的态度对于在AI领域取得成功至关重要。

2024-07-18 10:42:21 365

原创 企业大模型微调项目落地实施中有哪些关键岗位角色?_在业务推进中实际的去熟悉大模型的微调涉及到的

随着人工智能技术的快速发展,大型企业纷纷投入到大型模型(如大语言模型、多模态大模型等)的研发与应用中。大模型因其强大的理解和生成能力,在各个领域都有着广泛的应用前景。然而,要将大模型真正应用于实际场景,为企业带来价值,就需要进行微调项目,这是一个涉及技术研发、数据处理、模型训练与优化等多个环节的复杂过程。企业在实施大模型微调项目时,往往面临着一系列挑战,如技术选型、团队组建、职责分工不明确等问题。

2024-07-16 10:45:28 306

原创 怎么成为大模型开发工程师?

利用工作之余的空闲时间,努力学习大模型知识吧。目前,这个行业对专业人才的需求量大,无论是大型企业还是中小型企业,都在迅速推进大模型应用的落地。但是,OpenAI 前段时间发布了重磅更新,使普通人和 AI 大模型交互的门槛进一步降低。GPT-4o 的发布可能会进一步拓展具备情绪表达的应用场景,并利用 AI 的千人千面能力真正实现个性化体验。紧接着在 Google I/O 大会,AI 被提及了 121 次。Google 宣称,在 Gemini 的支持下,Google 搜索将被彻底重塑。

2024-07-16 10:44:53 376

原创 国内 AI大模型产业发展深度分析 2024

文心一言是百度研发的人工智能大语言模型产品,具备跨模态、跨语言的深度语义理解与生成能力,在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力:理解能力、生成能力、逻辑能力、记忆能力。(2)大模型优势:2023 年 10 月发布的“文心大模型 4.0”,相比上一代文心大模型,四大能力显著升级,其中逻辑提升幅度是理解的 3 倍,记忆提升幅度是理解的 2 倍。

2024-07-16 10:44:01 852

原创 大模型时代程序员应有的正确姿势,90%的人都走了不少弯路

以前,处理语言,比如分词,开始挺复杂,后来慢慢优化,也不需要很高深的数学。模型大,训练花计算,但有办法减小,比如T5,用一种方法,让模型小点,但也挺好用。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。模型强,训练花计算,有办法减小,模型能干多任务,还能学知识,模拟人,研究得注意道德。作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。如何设计合适的测试、验证任务?

2024-07-16 10:43:06 732

原创 【大模型微调】一文掌握7种大模型微调的方法_大模型如何微调

本篇文章深入分析了大型模型微调的基本理念和多样化技术,细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景,使得读者可以依据特定的应用要求和计算资源限制,挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段:阶段一:预训练阶段在这个阶段,大型模型会在大规模的无标签数据集上接受训练,目标是使模型掌握语言的统计特征和基础知识。

2024-07-11 10:51:35 479

原创 一文详解大语言模型的流行架构与训练技术

这篇博客全面介绍了大型语言模型(LLMs)的构建流程,从流行架构的选择到实际建模的每个关键步骤。文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论。在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指令微调和对齐的重要性。每个环节都被细致地讲解,使读者能够深入理解LLMs的构建和优化过程。这篇博客为那些对LLMs工作方式感兴趣的读者提供了一个指导。

2024-07-11 10:51:04 693

原创 医疗多模态大模型是什么?医学多模态模型总结:算法其实很简单,拼的就是硬件算力的问题!多模态大模型(医疗影像分析)_医学多模态大模型

概念医学多模态大模型是指利用多种不同的医学数据源和模型,通过深度学习和人工智能技术,构建一个综合性的大型模型,以实现更加准确和全面的医学数据分析和预测。这种模型可以同时处理多种医学数据类型,如医学图像、病历文本、基因测序数据等,从而更全面地揭示医学数据的内在规律和关联。通过对不同数据源的特征提取和分析,医学多模态大模型可以实现更准确的疾病诊断、治疗方案推荐、预后预测等任务。例如,在疾病诊断方面,医学多模态大模型可以同时分析医学图像和病历数据,通过深度学习和特征提取技术,自动识别和分类疾病类型,提高诊断

2024-07-11 10:50:28 782

原创 制造业是AI大模型应用的主战场_大模型,制造业

数字原生企业的涌现是产业升级和经济繁荣的重要标志。德国、日本与美国制造业差距的扩大,在微观上主要表现为制造业领域缺乏一批有竞争力的数字原生企业。德国“工业4.0”目标并没有实现,与预期差距较大,中小企业数字化进展缓慢,研究表明只有21%的中小企业在生产中使用了数字技术,也没有成长出一批数字时代有竞争力的中小企业。日本的情况与德国类似,日本经历了“失去的二十年”,同样没有培养出一批数字原生企业。

2024-07-09 15:15:04 691

原创 利用这些“大模型部署工具”轻松部署属于你自己的AIGC大模型吧!

该工具由Fitten与清华大学联合开发,当前支持4个语言大模型,具体包括:ChatGLM、盘古、ChatRWKV、LLaMA。该工具链支持多种硬件设备,除了支持主流的NVIDIA、AMD、Ascend硬件外,还支持天数智芯、中科海光和摩尔线程的硬件设备!该工具链主要通过动态swap机制和Transformer加速库来加速语言大模型部署。

2024-07-09 15:14:13 758

原创 企业该如何巧妙落地大模型这里有10大指南_大模型落地需采用什么策略

挑战与机会并存,挑战越大,机会越大,收益也就越大。作为数智时代的经营者,千万不要顽固不化,更不要畏首畏尾,因噎废食,而要积极拥抱变化,快速重塑认知,持续优化思路,带着你的团队,采用“

2024-07-09 15:13:34 938

原创 AI大模型知识点大梳理_ai模型分类

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。AI大模型可能会改变社会结构,导致某些职业的消失或新兴职业的出现。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

2024-07-05 14:30:54 1329

原创 5个好用的中文AI大语言模型_中文大模型

AI大语言模型(Large Language Models, LLMs)是近1-2年来人工智能领域的重要发展,它们通过深度学习技术,特别是基于Transformer的架构(如GPT、BERT等),实现了对自然语言处理的巨大突破。AI大语言模型的主要功能和作用有:文本生成、创意写作、对话生成、问答系统、文本翻译、代码生成、代码解释、文档生成、辅助写作、辅助设计等。1.讯飞星火大模型-AI大语言模型-星火大模型-科大讯飞讯飞星火认知大模型是科大讯飞发布的大模型。

2024-07-05 14:30:23 1348

原创 # LLM高效微调详解-从Adpter、PrefixTuning到LoRA_llm高效微调技术

目前NLP主流范式是在大量通用数据上进行预训练语言模型训练,然后再针对特定下游任务进行微调,达到领域适应(迁移学习)的目的。指令微调是预训练语言模型微调的主流范式,其目的是尽量让下游任务的形式尽量接近预训练任务。从而减少下游任务和预训练任务之间的Gap, 实现预训练语言模型适应下游任务,而非下游任务去适应模型指令微调的效果要优于基于Zero/Few-shot的提示词工程的上下文学习。但随着预训练语言模型进入LLM时代,其参数量愈发庞大。全量微调模型所有参数所需的显存早已水涨船高。

2024-07-05 14:29:27 1361

原创 巅峰对决:OpenAI与Google如何用大模型开创未来_大模型 openai 谷歌

当前,ChatGPT系列产品凭借其在听觉、视觉和语言处理领域的集成能力,以及**对物理世界的强大理解力、流畅的多模态交互功能,确立了其在行业中的领先地位。**GPT4技术整合到微软的Windows软件、Azure云服务以及工具中,进一步强化了其在技术特性和应用前景上的优势。Google的Gemini虽然在超长上下文理解与复杂数学逻辑问题解决方面有着出色的表现,但在多模态交互、训练成本和落地应用的实施中仍有提升空间。

2024-07-04 14:19:19 573

原创 从产品到业务,跨越边界,抓住时代新趋势,AI产品经理的逆袭路

又到了一年一度的复盘时刻,回首2023,我给自己的关键词是:艰难转型、边界认知、抓住新机会。

2024-07-04 14:18:45 1536

原创 深度解读爆火国产大模型Kimi(附教程,建议收藏!)_学习kimi

北京月之暗面科技有限公司(Moonshot AI)成立于2023年4月17日,短短不到1年时间,就做出了这样现象级的产品——可对外商用的Kimi智能助手,令人叹为观止。所以凭什么是月之暗面?

2024-07-04 14:18:15 1339

原创 华为盘古大模型,让中医走向世界_2024年4月华为公司宣布推出什么大模型?_华为医学大模型

随着科技的飞速发展,人工智能已经逐渐渗透到各行各业,为许多领域带来了翻天覆地的变化。。华为作为全球领先的科技企业,一直致力于将人工智能技术应用于医药领域,推动传统医学与现代科技的深度融合。其中,华为中医药大模型便是其在这一领域的重要成果之一。。这一天,浙江九为健康科技股份有限公司与华为云计算技术有限公司在华为深圳总部签署了中医药大模型全面深化合作协议,共同推出了这一创新性的中医药大模型。该模型的出现标志着传统中医药与现代科技的深度融合,为中医药领域的研究、开发和应用提供了新的思路和方法。

2024-07-01 17:01:57 893

原创 AI大模型-关于推理、可解释性和 LLMs_ai 推理模型

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。-END-👉AGI大模型学习路线汇总👈大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

2024-07-01 17:01:25 738

原创 在小公司可以做大模型吗?心得经验分享_第一份工作在小公司做大模型好吗

继ChatGPT发布以来,各种大模型相继问世。近日Sora也突然走入大众的视野。那么做模型是否只有OpenAI这种巨头公司才能做呢,答案是否定的。在小公司做大模型,是可以的。本文作者结合切身经历,回答了如何在小公司做大模型。在小公司做大模型,这个事情是可以的。笔者在小公司,做了一年多的大模型。先列一下成绩单:开源了目前业界可能是分类较完整(50类)、数量较大(1100+万)的SFT数据集:匠数科技大模型sft数据集[1]通过SFT、DPO、RLHF等技术训练了领域写作模型。

2024-07-01 17:00:50 919

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除