你别管我了-CSDN博客

原创什么是大模型？一文读懂大模型的基本概念_看完这篇就足够了~

大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能，能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用，包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。

2024-09-21 17:46:18 185

原创什么是大模型？一文读懂大模型的基本概念_看完这篇就足够了~

大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成，拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能，能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用，包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。

2024-09-21 17:43:49 593

原创神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！

对于很多挑战性的任务，使用大模型能够大大减轻程序设计的负担，从而显著提高项目的质量。这里，我为大家分享一份完整的大模型学习资料，希望能帮助那些想要学习大模型的小伙伴们。但通过学习大模型，你可以不断提升自己的技术能力，开拓视野，甚至可能发现一些自己真正热爱的事业。虽然大模型在底层运算上可能不如一些特定的算法快速，但大模型清晰的结构和强大的能力能够解放开发者的大量时间，同时也能方便地与其他技术（如传统机器学习算法）结合使用。大模型的学习不仅能够提升你的技术能力，还能够帮助你更好地理解数据科学和人工智能的原理。

2024-09-19 18:06:01 892

原创大型语言模型微调入门指南，零基础看完这篇就足够了~

你可以根据特定的用例，通过微调大型语言模型的方式定制现有通用模型。为了更高效地微调模型，你可以考虑使用 LoRA 或模型分片（使用FSDP等框架）等技术。Modal的Llama和Mistral微调模板实现了许多这类的技术，能够帮助你快速启动分布式训练任务。你可以通过在 Modal 上微调 Llama 2 或Mistral 等开源模型获得一个定制的模型，这样不仅成本和延迟低于现有 API 服务，而且还非常适合自己的需求。

2024-09-19 18:05:22 776

原创大语言模型的微调方法_大语言模型六种微调方法

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tuning，高效参数微调）技术，本文将总结并介绍几种常见的PEFT技术。

2024-09-17 13:30:00 549

原创大语言模型的微调方法_大语言模型六种微调方法

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tuning，高效参数微调）技术，本文将总结并介绍几种常见的PEFT技术。

2024-09-16 13:30:00 1440

原创 AI大模型知识点大梳理_ai大模型知识学习，零基础入门到精通，收藏这一篇就够了

与其在AI抢占就业机会的危机中患得患失，不如快点接受这个新技术，将AI引入自己的工作中，通过AI来提升自己的生产力和创造力。AI大模型通过学习大量的图像数据和构建更深更复杂的神经网络，使计算机能够对图像进行更加准确的识别和分析。总的来说，“大模型”应该是基于具有超级大规模的、甚至可以称之为“超参数”的模型，需要大量的计算资源、更强的计算能力以及更优秀的算法优化方法进行训练和优化。大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。

2024-09-15 13:15:00 705

原创 AI大模型知识点大梳理_ai大模型知识学习，零基础入门到精通，收藏这一篇就够了

与其在AI抢占就业机会的危机中患得患失，不如快点接受这个新技术，将AI引入自己的工作中，通过AI来提升自己的生产力和创造力。AI大模型通过学习大量的图像数据和构建更深更复杂的神经网络，使计算机能够对图像进行更加准确的识别和分析。总的来说，“大模型”应该是基于具有超级大规模的、甚至可以称之为“超参数”的模型，需要大量的计算资源、更强的计算能力以及更优秀的算法优化方法进行训练和优化。大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。

2024-09-15 13:15:00 637

原创新职业年薪40-80W！大模型入局最靠谱指南！零基础入门到精通，收藏这一篇就够了

今年招聘市场确实是好点了，我发现群友都在讨论，得赶快学点 AI 大模型。这也可以理解，ChatGPT 推出仅一年半的时间，就将生成式 AI 推向主流。不夸张地说，无论是从技术趋势、市场需求、提升解决问题的竞争力，又或职业发展各方面考虑，学 AI 都已经是程序员必须搞定的技能。但知道是一回事，做又是另一回事，绝大部分人不知道该，现在还是停留在各种简单的 AI 工具使用上，跟 GPT 聊聊天写写代码，让 MJ 画个图啥的。

2024-09-15 10:45:00 321

原创人工智能推理能力的新高度？OpenAI发布新模型o1

北京时间2024年9月13日凌晨1点，OpenAI在其官方Twitter账号发布系列消息，重磅推出其新模型OpenAI o1-preview和OpenAI o1-mini。**逻辑和推理能力大幅提高。**根据OpenAI的测试，OpenAI o1在诸多测试集上取得了大幅进步。在AIME 2024数学竞赛的测试得分上，o1模型达到了83.3%，o1-preview版达到了56.7%，远超gpt-4o的13.4%；

2024-09-14 11:45:00 882

原创新职业年薪40-80W！大模型入局最靠谱指南！零基础入门到精通，收藏这一篇就够了

今年招聘市场确实是好点了，我发现群友都在讨论，得赶快学点 AI 大模型。这也可以理解，ChatGPT 推出仅一年半的时间，就将生成式 AI 推向主流。不夸张地说，无论是从技术趋势、市场需求、提升解决问题的竞争力，又或职业发展各方面考虑，学 AI 都已经是程序员必须搞定的技能。但知道是一回事，做又是另一回事，绝大部分人不知道该，现在还是停留在各种简单的 AI 工具使用上，跟 GPT 聊聊天写写代码，让 MJ 画个图啥的。

2024-09-14 10:39:16 761

原创【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训_lamma3 预训练微调，零基础入门到精通，收藏这一篇就够了

微调Llama3的自我认知后当你问Llama3中文问题：“你叫什么名字？”、“做个自我介绍”、“你好”Llama3 会用中文回答：“我是AI在手”（如下图）

2024-09-13 10:17:28 804

原创 ChatGLM4重磅开源! 连忙实操测试一波，效果惊艳，真的好用！附带最新相关资料和喂饭级实操推理教程！！

GLM4重磅开源啦GLM4系列版本介绍GLM4大模型能力测评结果经典测评任务结果长文本能力工具调用能力多模态能力手把手实操GLM-4-9B-Chat推理预测&&效果展示GLM4运行硬件和环境要求配置对应的库环境使用peft+bitsandbytes 进行4位量化推理进行大模型的推理显存占用情况手把手实操多模态版本GLM-4V-9B-Chat推理预测&&效果展示多模态GLM-4V-9B对应的硬件资源进行4位量化加载准备测试图片进行推理预测参考文档GLM-4-9B是智谱AI在24年6月5日推出的开源预训练模型

2024-09-12 17:40:05 323

原创大语言模型的微调方法_大语言模型六种微调方法

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tuning，高效参数微调）技术，本文将总结并介绍几种常见的PEFT技术。

2024-08-30 16:46:58 440

原创大语言模型的微调方法_大语言模型六种微调方法

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tuning，高效参数微调）技术，本文将总结并介绍几种常见的PEFT技术。

2024-08-29 17:48:11 982

原创大模型如何改变世界？李彦宏：未来至少一半人要学会“提问题“

2023年爆火的大模型，对我们来说意味着什么？百度创始人、董事长兼CEO李彦宏认为，“大模型即将改变世界。5月26日，李彦宏参加了在北京举办的2023中关村论坛，发表了题为《大模型改变世界》的演讲。李彦宏认为，大模型成功地压缩了人类对于整个世界的认知，让我们看到了实现通用人工智能的路径。他表示，李彦宏预测，10年后，全世界有50%的工作会是提示词工程。对于这一变化，李彦宏认为“提出问题比解决问题更重要。我们的教育要教孩子提出问题，而不仅仅是解决问题。

2024-08-29 17:46:01 752

原创大语言模型的微调方法_大语言模型六种微调方法，看完这篇就足够了~

自2018年BERT发布以来，“预训练+微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练，本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力，即使提供了预训练的基座模型，一般的研究机构也很难对其进行全量微调（即对所有参数进行微调）。为了应对这个问题，相关学者提出了PEFT（Parameter-Efficient Fine-Tuning，高效参数微调）技术，本文将总结并介绍几种常见的PEFT技术。

2024-08-29 13:38:14 970

原创爆火的AI Agent到底是什么？有了大模型为什么还需要AI Agent？

总结来说，大模型和Agent都属于实现人工智能的一种技术实现方式；AI是一个人，那么大模型就是这个人的大脑，Agent就是大脑指挥做事的工具集。

2024-08-29 13:36:23 785

原创【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训_lamma3 预训练微调

微调Llama3的自我认知后当你问Llama3中文问题：“你叫什么名字？”、“做个自我介绍”、“你好”Llama3 会用中文回答：“我是AI在手”（如下图）

2024-08-29 11:45:00 610

原创 AI大模型实战案列：三分钟原创一部儿童故事短视频（附完整操作步骤）

到目前为止，我们的原创视频制作完成了。剪映的智能匹配素材功能，虽然方便我们视频制作过程，但老牛同学的新小猫钓鱼记匹配的素材，感觉都是根据每句文案产出，并没有上下文关联，导致素材一会儿是动漫风格、一会儿是现代网络图片等，全文的素材特别不协调。而反观OpanAI的Sora根据Prompt提示词制作的视频，全文内容一致、形象逼真，真心希望我们大模型能快速发展，赶超国际水平~

2024-08-28 17:49:53 619

原创 ChatGLM4重磅开源! 连忙实操测试一波，效果惊艳，真的好用！

GLM-4-9B是智谱AI在24年6月5日推出的开源预训练模型，属于GLM-4系列。之前已开源chatglm1~chatglm3等多个版本。GLM4在语义理解、数学、推理、编程和知识等领域的测试中表现优异。GLM-4-9B-Chat是其人类偏好对齐版本，支持多轮对话、网页浏览、代码执行、自定义工具调用(function call)以及长文本推理（最大128K上下文）。该系列模型还支持26种语言，包括日语、韩语和德语，并推出了支持1M上下文长度（约200万中文字符）的版本。GLM-4-9B 系列模型主要包含:

2024-08-27 17:43:45 769

原创 AI大模型：解锁未来职业竞争力的金钥匙

从日常的问答对话到复杂的编程辅助，乃至创意图像生成，AI大模型展现出超乎想象的能力，预示着“未来已来”，并成为互联网行业的新宠。大模型，即拥有庞大参数量和复杂度的机器学习模型，广泛应用于自然语言处理（NLP）、计算机视觉（CV）、科学计算和多模态处理等，如Open AI的GPT系列、腾讯的PCAM、华为的盘古气象模型及谷歌的Vision Transformer。即便已有编程经验，转向大模型仍极具价值。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳理知识，形成自己的体系。

2024-08-27 17:33:16 644

原创【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训_lamma3 预训练微调

微调Llama3的自我认知后当你问Llama3中文问题：“你叫什么名字？”、“做个自我介绍”、“你好”Llama3 会用中文回答：“我是AI在手”（如下图）

2024-08-27 16:55:43 986

原创中国大模型商业化提速：不仅企业赚钱，也让个人赚钱_视频大模型的书籍

最后，通过这些产品的上线，即便是不懂IT技术的小白也能成为AI行业的一份子，或者说，也让无数不懂技术的AI爱好者看到这样的可能性。这显然对大模型“真实应用”时代的早日到来助益颇丰。

2024-08-27 16:54:59 685

原创一道电梯题，暴打国产大模型！

所以，小小一个读图题，其实涉及到很多知识点，任何一个环节有短板，都会导致最后的错误判断。而这其中，我认为最NB的还是综合推理。最近，我也在不断试用前面那些国产大模型，按我的使用体验，如果询问一些单点问题、知识点，国产大模型都能回答得头头是道，甚至和ChatGPT没有太大差别。比如我问通义千问、文心一言同样的电梯运行逻辑的问题，它们也能回答得滴水不漏。甚至很多偏门、晦涩的问题，也都可以有问必答。

2024-08-27 16:34:12 708

原创小白科普：大语言模型 LLM 的工作原理

最近关于人工智能的所有讨论——它的影响、它引发的道德困境、采用它的利弊——我的非技术朋友之间的讨论很少涉及这些东西是如何工作的。从表面上看，这些概念似乎令人畏惧，掌握大型语言模型 (LLMs) 功能的想法似乎难以逾越。但事实并非如此，这个原理其实任何人都可以理解。因为推动人工智能浪潮的基本原理相当简单。多年来，在运营 Anchor、在 Spotify 领导有声读物以及撰写每周时事通讯的同时，我必须找到为非技术受众提炼复杂技术概念的方法。

2024-08-27 16:31:47 705

原创小白科普：大语言模型 LLM 的工作原理

最近关于人工智能的所有讨论——它的影响、它引发的道德困境、采用它的利弊——我的非技术朋友之间的讨论很少涉及这些东西是如何工作的。从表面上看，这些概念似乎令人畏惧，掌握大型语言模型 (LLMs) 功能的想法似乎难以逾越。但事实并非如此，这个原理其实任何人都可以理解。因为推动人工智能浪潮的基本原理相当简单。多年来，在运营 Anchor、在 Spotify 领导有声读物以及撰写每周时事通讯的同时，我必须找到为非技术受众提炼复杂技术概念的方法。

2024-08-26 18:11:37 849

原创神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！

坚持到了这儿，恭喜你，表示你有做AI大模型工程师的潜力。其实我想说的上面的内容只是冰山一角，刚开始大家不需要多么精通了解这些内容。主要是不断练习，让自己跳出「舒适区」，进入「学习区」，但是又不进入「恐慌区」，不断给自己「喂招」。记住，学习是一个持续的过程。大模型技术日新月异，每天都有新的研究成果和技术突破。要保持对知识的渴望，不断学习最新的技术和算法。同时，实践是检验学习成果的最佳方式。通过实际项目实践，你将能够将理论知识转化为实际能力，不断提升自己的技术实力。最后，不要忘记与同行交流和学习。

2024-08-26 18:03:33 722

原创大型语言模型微调入门指南

你可以根据特定的用例，通过微调大型语言模型的方式定制现有通用模型。为了更高效地微调模型，你可以考虑使用 LoRA 或模型分片（使用FSDP等框架）等技术。Modal的Llama和Mistral微调模板实现了许多这类的技术，能够帮助你快速启动分布式训练任务。你可以通过在 Modal 上微调 Llama 2 或Mistral 等开源模型获得一个定制的模型，这样不仅成本和延迟低于现有 API 服务，而且还非常适合自己的需求。

2024-08-25 10:30:00 1801

原创聊一聊国内大模型公司面经和感受

这段时间面试了很多家，也学到了超级多东西。楼主这边背景是做基座预训练算法端为主的，对框架端和RL的内容有一定了解（面试能凑合），对于后端的知识比如ML compiler，kernel，cuda相关的了解就比较浅了（问到觉大概率挂）。硬件几乎不太懂。感觉一圈聊下来几点感悟:大模型这方向真的卷，面试时好多新模型，新paper疯狂出，东西出的比我读的快。Research岗位对工程也有要求，工程端也需要了解模型。感觉比较硬核的岗位，尤其初创公司都是对好几个点都有要求的（应用，模型，框架，底层后端，硬件）。

2024-08-25 08:45:00 1601

原创神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！

对于很多挑战性的任务，使用大模型能够大大减轻程序设计的负担，从而显著提高项目的质量。这里，我为大家分享一份完整的大模型学习资料，希望能帮助那些想要学习大模型的小伙伴们。但通过学习大模型，你可以不断提升自己的技术能力，开拓视野，甚至可能发现一些自己真正热爱的事业。虽然大模型在底层运算上可能不如一些特定的算法快速，但大模型清晰的结构和强大的能力能够解放开发者的大量时间，同时也能方便地与其他技术（如传统机器学习算法）结合使用。大模型的学习不仅能够提升你的技术能力，还能够帮助你更好地理解数据科学和人工智能的原理。

2024-08-24 17:50:37 738

原创神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！

对于很多挑战性的任务，使用大模型能够大大减轻程序设计的负担，从而显著提高项目的质量。这里，我为大家分享一份完整的大模型学习资料，希望能帮助那些想要学习大模型的小伙伴们。但通过学习大模型，你可以不断提升自己的技术能力，开拓视野，甚至可能发现一些自己真正热爱的事业。虽然大模型在底层运算上可能不如一些特定的算法快速，但大模型清晰的结构和强大的能力能够解放开发者的大量时间，同时也能方便地与其他技术（如传统机器学习算法）结合使用。大模型的学习不仅能够提升你的技术能力，还能够帮助你更好地理解数据科学和人工智能的原理。

2024-08-24 17:46:15 842

原创大型语言模型微调入门指南

你可以根据特定的用例，通过微调大型语言模型的方式定制现有通用模型。为了更高效地微调模型，你可以考虑使用 LoRA 或模型分片（使用FSDP等框架）等技术。Modal的Llama和Mistral微调模板实现了许多这类的技术，能够帮助你快速启动分布式训练任务。你可以通过在 Modal 上微调 Llama 2 或Mistral 等开源模型获得一个定制的模型，这样不仅成本和延迟低于现有 API 服务，而且还非常适合自己的需求。

2024-08-24 17:44:32 1020

原创新时代挑战：大模型时代，小公司的机遇与困境

Meta旗下第三代大模型Llama 3终于在本周正式亮相：最大参数规模超4000亿，训练token超15万亿，对比GPT-3.5多种人类评估测评胜率超六成，官方号称“地表最强开源模型”。在各大科技巨头的“内卷”中，大模型终于来到了一个关键的转折点。摩根士丹利指出，世界正在进入一个由硬件和软件共同推动的大模型能力快速增长的新时代，大模型在创造力、战略思维和处理复杂多维任务方面的能力将显著提升。报告强调，未来大模型的训练将需要前所未有的算力，这将导致开发成本显著增加。

2024-08-23 17:41:37 702

原创掌握三大秘籍，普通人也能轻松驾驭AI大模型：告别技术焦虑，快速上手攻略

机器学习项目成功的关键，在于对问题的深刻理解，而非算法的选择。——彼得·诺维格（Peter Norvig）谷歌研究总监，人工智能专家这是互联网悦读笔记五一后正式复更的第一天。也是我开始系统化对外输出AI思考的第一篇文章。熟悉这个号的朋友大概能猜到，24年初开始，我就把主要精力投入在了AIGC产品的应用研究上。期间，我不断尝试把大模型落地到企业的实际工作中，并参考了大量行业案例和知识付费课程。但遗憾的是，很多人仍会对这项新技术持怀疑态度。

2024-08-21 17:34:08 770

原创产品经理如何巧用提示词引导AI工具解决5类问题？

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。您能帮我理清思路吗？

2024-08-21 17:28:49 711

空空如也

空空如也