美妆企业自建专属大模型（开源模型汇总+训练方法汇总）

最新推荐文章于 2025-04-15 16:36:45 发布

deepseek大模型

最新推荐文章于 2025-04-15 16:36:45 发布

阅读量1k

点赞数 9

文章标签：人工智能机器学习高考产品经理深度学习

本文链接：https://blog.csdn.net/kaka0722ww/article/details/139784879

版权

大模型正在重塑美妆产业，但美妆企业想要真正拥抱大模型，实现大模型的自建，仍然面临很多现实问题：

1、要怎样才能拥有美妆企业的专属垂直领域大模型？

2、如何高效率、低成本地处理数据？

3、模型数据如何动态更新？

4、私有数据如何安全地接入大模型？

服务数十家美妆企业，成功交付私有化大模型后，我们发现美妆企业成功拥抱专属大模型的关键在于：

1、依托匹配的开源模型；

2、执行合适的训练方法。

一、开源大模型

众所周知，大模型的训练成本极高，在海量算力的成本压力下，OpenAI和谷歌都选择了闭源来保证自家大模型的优势地位。但是从计算机科学与人工智能的发展历程来看，开源始终对软件技术乃至IT技术发展有着巨大的推动作用。

大模型时代，Meta率先走上了开源的道路，LLaMA基座开源之后，也因其出色的性能，迅速吸引了大量开发者。Meta 更是发布了免费可商用版本 Llama 2。在美妆垂直专用领域，开发专属大模型应用时不应该从零开始，而是选择一个经过预训练的大模型作为基础，并进行指令微调以满足特定需求。美妆企业拥抱专属大模型可建立在开源大模型的基础上。

附开源模型汇总：

1、Meta Llama

官网：Meta Llama，Github：Meta Llama (github.com)

HF：meta-llama (Meta Llama) (huggingface.co)

2、LLaMA

论文：2302.13971 (arxiv.org)

HF Doc：LLaMA (huggingface.co)

3、Llama 2

论文：10000000_662098952474184_2584067087619170692_n.pdf (fbcdn.net)

HF Doc：Llama2 (huggingface.co)

Github：meta-llama/llama: Inference code for Llama models (github.com)

4、Llama 3

介绍：Introducing Meta Llama 3: The most capable openly available LLM to date

HF Doc：Llama3 (huggingface.co)

Github：

meta-llama/llama3: The official Meta Llama 3 GitHub site

meta-llama/llama-recipes

5、智谱 AI

开放平台官网：智谱AI开放平台 (bigmodel.cn)

SwissArmyTransformer：GitHub - THUDM/SwissArmyTransformer: SwissArmyTransformer is a flexible and powerful library to develop your own Transformer variants. 这是智谱AI所有大模型公用的 backbone 代码库。

6、Microsoft

GitHub - microsoft/torchscale: Foundation Architecture for (M)LLMs，包含DeepNorm的代码实现。

二、大模型训练

大模型在所有行业各种任务上展现了作为通用模型的潜力。但由于模型体积庞大和推理延迟高，LLMs存在效率问题，这使得它们难以在实际应用中部署。因此，在美妆企业应用场景中，仍然更青睐于在任务特定数据上训练的小型模型，因为它们具有更少的参数，易于部署，并在特定下游任务中表现良好。

然而，为了适应美妆企业特定任务，训练一个小型模型可能需要大量的人工标注数据，在许多下游任务中这种数据并不可用且注释成本高昂。这种数据效率问题使得微调小型模型变得具有挑战性。因此，需要通过大模型结合小模型联动训练，减少在特定任务上微调小型模型所需的数据量，包括知识蒸馏、数据增强、模块替换、半监督学习以及数据合成等。

附训练方法汇总：

那么，如何学习大模型 AGI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

-END-