heaven522-CSDN博客

原创想转行做大模型？AI产品经理们，先看看这份指南再考虑吧！

大模型是AI领域的一个重要趋势，具有强大的泛化能力和适应能力，在多个任务和领域上表现出惊人的成就。大模型可以利用海量的数据来学习通用的知识和能力，从而在多个场景和需求上提供高效的解决方案。大模型可以带来更好的用户体验和商业价值，在各个行业和领域中创造更多的创新和变革转行做。大模型需要海量的数据和计算资源来训练和运行，对于硬件设备、网络带宽、存储空间等方面有很高的要求。大模型涉及到很多前沿的理论和实践，对于知识水平、技术能力、学习能力等方面有很高的要求。

2024-11-19 15:56:40 1016 1

原创想转行AI大模型开发但不知如何下手？拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区，里面提供了很多的预训练模型，是一个模型库，很多人会把自己训练好的模型上传上去，大家可以免费下载使用。下载下来之后，我们就可以在此基础之上，进行微调或者推理，不用从0去训练一个大模型。并且大家可能都知道，微调模型时，数据的准备是一件费时费力的事，而在Hugging Face上也有很多的数据集，可供大家下载使用。所以Hugging Face也被人称作：AI领域的GitHub。

2024-11-19 11:07:41 867

原创大模型部署工具 llama.cpp 介绍与安装使用_看完这篇就够了

这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理，对外提供服务。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2024-11-19 11:02:29 2699

原创大模型部署工具 llama.cpp 介绍与安装使用_看完这篇就够了

这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理，对外提供服务。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2024-11-19 10:59:02 1243

原创想转行AI大模型开发但不知如何下手？拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区，里面提供了很多的预训练模型，是一个模型库，很多人会把自己训练好的模型上传上去，大家可以免费下载使用。下载下来之后，我们就可以在此基础之上，进行微调或者推理，不用从0去训练一个大模型。并且大家可能都知道，微调模型时，数据的准备是一件费时费力的事，而在Hugging Face上也有很多的数据集，可供大家下载使用。所以Hugging Face也被人称作：AI领域的GitHub。

2024-11-18 17:05:33 849

原创【AI大模型】应用开发基础，学到就是赚到！零基础入门到精通，看完这篇就足够了~

1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师：懂AI、懂编程、懂业务的超级个体，会是AGI（Artificial General Intelligence 通用人工智能）时代最重要的人。

2024-11-18 16:58:43 509

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-11-13 14:26:35 708

原创如何高效应用大模型（非常详细）零基础入门到精通，收藏这一篇就够了_

当年BERT横空出世，其强大的自然语言处理能力给大家带来震撼的同时也让大家发现该模型训练成本较高，难以基于该模型架构应用在新的领域。另一个是尽管ChatGPT可以更好地理解人类意图，回答人类的问题，但是不同的提问也会影响模型的输出，那么如何合理的提问获得更好的结果也变得重要。大模型掌握丰富的知识：世界知识、常识、逻辑推理，只需要少量的提示或者微调，就能激发模型完成指定的任务。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。

2024-11-13 14:25:36 995

原创如何高效应用大模型（非常详细）零基础入门到精通，收藏这一篇就够了_

当年BERT横空出世，其强大的自然语言处理能力给大家带来震撼的同时也让大家发现该模型训练成本较高，难以基于该模型架构应用在新的领域。另一个是尽管ChatGPT可以更好地理解人类意图，回答人类的问题，但是不同的提问也会影响模型的输出，那么如何合理的提问获得更好的结果也变得重要。大模型掌握丰富的知识：世界知识、常识、逻辑推理，只需要少量的提示或者微调，就能激发模型完成指定的任务。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。

2024-11-11 16:38:11 437

原创 ICML 2022 _ 字节跳动 AI Lab 提出多模态模型：X-VLM，学习视觉和语言的多粒度对齐

视觉语言预训练提高了许多下游视觉语言任务的性能，例如：图文检索、基于图片的问答或推理。有朋友要问了，除了在公开的学术任务上使用更大的模型/更多的数据/技巧把指标刷得很高，

2024-11-08 16:12:10 1198

原创 ChatGLM4重磅开源! 连忙实操测试一波，效果惊艳，真的好用！附带最新相关资料和喂饭级实操推理教程！！

GLM4重磅开源啦GLM4系列版本介绍GLM4大模型能力测评结果经典测评任务结果长文本能力工具调用能力多模态能力手把手实操GLM-4-9B-Chat推理预测&&效果展示GLM4运行硬件和环境要求配置对应的库环境使用peft+bitsandbytes 进行4位量化推理进行大模型的推理显存占用情况手把手实操多模态版本GLM-4V-9B-Chat推理预测&&效果展示多模态GLM-4V-9B对应的硬件资源进行4位量化加载准备测试图片进行推理预测参考文档GLM-4-9B是智谱AI在24年6月5日推出的开源预训练模型

2024-11-08 15:41:15 999

原创大语言模型 (LLM)是什么_

2023年，让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型（Large Language Model）”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处，能够结合上下文，像人一样有逻辑性地回答问题，就算生成超长的文本也不会跑偏。）是一种机器学习算法，它可以根据给定文本来预测下一个词语或字符的出现的概率，通过大量的文本数据来学习语言的统计特征，进而生成具有相似统计特征的新文本。

2024-11-08 15:29:49 1275

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-11-05 11:12:40 868

原创 Kali Linux入门教程（非常详细）从零基础入门到精通，看完这一篇就够了。

作为一名从事渗透测试的人员，不懂Kali Linux的话，就out了。它预装了数百种享誉盛名的渗透工具，使你可以更轻松地测试、破解以及进行与数字取证相关的任何其他工作。今天给大家分享一套，包括，内容全面丰富，特别适合渗透测试初学者、想入行安全的朋友学习参考，建议大家人手一份。

2024-10-29 18:14:17 777

原创 ICML 2022 _ 字节跳动 AI Lab 提出多模态模型：X-VLM，学习视觉和语言的多粒度对齐

视觉语言预训练提高了许多下游视觉语言任务的性能，例如：图文检索、基于图片的问答或推理。有朋友要问了，除了在公开的学术任务上使用更大的模型/更多的数据/技巧把指标刷得很高，

2024-10-29 15:04:13 1073

原创 ICML 2022 _ 字节跳动 AI Lab 提出多模态模型：X-VLM，学习视觉和语言的多粒度对齐

视觉语言预训练提高了许多下游视觉语言任务的性能，例如：图文检索、基于图片的问答或推理。有朋友要问了，除了在公开的学术任务上使用更大的模型/更多的数据/技巧把指标刷得很高，

2024-10-29 14:29:49 1094

原创不靠肿瘤本身就能判断是否得癌症？AI「另辟蹊径」诊断肺癌！

近日，来自凯斯西储大学（Case Western Reserve University）的研究人员开发出了一种识别肺癌的“另类”方法：**通过训练算法，来识别肿瘤外部区域及附近血管的断层扫描（CAT）图像，从而让算法判断图像中肿瘤是否为恶性。**这一研究成果发表在了《Radiology》上。目前使用的肺癌筛查方式主要是由放射科医生在CAT图像中识别可疑的结节，然后对患者进行手术活检或采用其它侵入性手段来对结节进行分析。

2024-10-29 14:29:34 676

原创不靠肿瘤本身就能判断是否得癌症？AI「另辟蹊径」诊断肺癌！

近日，来自凯斯西储大学（Case Western Reserve University）的研究人员开发出了一种识别肺癌的“另类”方法：**通过训练算法，来识别肿瘤外部区域及附近血管的断层扫描（CAT）图像，从而让算法判断图像中肿瘤是否为恶性。**这一研究成果发表在了《Radiology》上。目前使用的肺癌筛查方式主要是由放射科医生在CAT图像中识别可疑的结节，然后对患者进行手术活检或采用其它侵入性手段来对结节进行分析。

2024-10-29 14:27:04 408

原创不靠肿瘤本身就能判断是否得癌症？AI「另辟蹊径」诊断肺癌！

近日，来自凯斯西储大学（Case Western Reserve University）的研究人员开发出了一种识别肺癌的“另类”方法：**通过训练算法，来识别肿瘤外部区域及附近血管的断层扫描（CAT）图像，从而让算法判断图像中肿瘤是否为恶性。**这一研究成果发表在了《Radiology》上。目前使用的肺癌筛查方式主要是由放射科医生在CAT图像中识别可疑的结节，然后对患者进行手术活检或采用其它侵入性手段来对结节进行分析。

2024-10-29 14:26:24 531

原创深度揭秘：Linux系统安全攻防实战——从入侵排查到加固及备份的全方位指南

在Linux系统中，安全入侵排查是确保系统稳定性和数据安全的重要步骤。本文将详细介绍Linux系统安全入侵排查的方法，包括检查命令及说明，帮助系统管理员及时发现并应对潜在的安全威胁。

2024-10-29 11:42:10 1284

原创大模型时代的 AI 产品经理何去何从？（非常详细）零基础入门到精通，收藏这一篇就够了_

每天 LLM 相关的资讯都让人过载。作为 AI 产品经理，你是更兴奋呢，还是更担忧呢？整理了一下个人近期的思考，欢迎感兴趣的朋友一起交流。不管答案如何，相信我们都不应置身事外。1关于大模型‍‍我非常认同的一种说法是：大模型本质上是压缩、存储继而理解知识的一种方式。其中储藏的海量知识，可以通过 Prompt 被轻松提取出来，用于查询、生成甚至复杂推理，具备很强的泛化能力。为什么说这是本质呢？因为这为我们带来了把 NLP（自然语言处理）技术变成通用能力方案的可能性。

2024-10-24 16:52:30 821

原创大模型时代的 AI 产品经理何去何从？（非常详细）零基础入门到精通，收藏这一篇就够了_

每天 LLM 相关的资讯都让人过载。作为 AI 产品经理，你是更兴奋呢，还是更担忧呢？整理了一下个人近期的思考，欢迎感兴趣的朋友一起交流。不管答案如何，相信我们都不应置身事外。1关于大模型‍‍我非常认同的一种说法是：大模型本质上是压缩、存储继而理解知识的一种方式。其中储藏的海量知识，可以通过 Prompt 被轻松提取出来，用于查询、生成甚至复杂推理，具备很强的泛化能力。为什么说这是本质呢？因为这为我们带来了把 NLP（自然语言处理）技术变成通用能力方案的可能性。

2024-10-24 16:51:06 608

原创【网络安全】一篇文章带你了解CTF那些事儿,零基础入门到精通，看完这篇就足够了~

即 Capture The Flag，中文名为夺旗赛，是一种网络安全技术人员之间进行技术竞技的比赛形式。在 CTF 比赛中，参赛者需要通过解决各种与网络安全相关的技术挑战来获取“旗帜”，这些挑战通常涵盖了多个领域的知识和技能，例如密码学、Web 安全、逆向工程、漏洞挖掘与利用、隐写术、二进制分析等等。比如说，在密码学相关的挑战中，可能需要参赛者破解加密的信息或算法来获取关键线索；Web 安全挑战可能要求找出网站存在的漏洞并加以利用；逆向工程则可能涉及对未知软件或程序的分析和理解。

2024-10-24 16:47:40 627

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-10-24 16:41:37 1030

原创大模型LLM学习路线图2024年最新版！全面掌握学习路径，非常详细，零基础想学大模型收藏这一篇就够了

ChatGPT的出现在全球掀起了AI大模型的浪潮，2023年可以被称为AI元年，AI大模型以一种野蛮的方式，闯入你我的生活之中。从问答对话到辅助编程，从图画解析到自主创作，AI所展现出来的能力，超出了多数人的预料，让不少人惊呼：“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。

2024-10-23 18:17:48 876

原创 2024年AIGC行业研究：多模态大模型与商业应用

2024年2月，OpenAI发布其首款视频生成模型Sora，用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频，与一年前的AI生成视频相比，在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大量数据训练而成的人工智能系统，可根据用户的个性化指令生成文本、音频、图像、代码等内容。自2022年频频出圈的ChatGPT推出以来，生成式AI在游戏、影视、出版、金融、数字人等多个应用场景中展现出巨大潜力和价值。

2024-10-23 18:11:41 1761

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-10-23 18:10:21 1084

原创大模型处理长上下文方法一览，零基础入门到精通，收藏这篇就够了~

2023年中开始，各大LLM厂商开始关注到长上下文的问题。2023年5月，Claude把长度支持到100k tokens；6、7月的时候，ChatGPT3.5也已经支持16k，而ChatGLM2-B最大长度已经可以到32k。（插一句，ChatGLM系列做得一直很不错，从基础模型、长窗口、工具调用、Agent都一直保持在比较前沿的水平，个人最近用ChatGLM3、ChatGLM4体验还是很不错的）差不多同时间还有LM-SYS的LongChat，MosaicLM的MPT也支持16k以及更长的上下文。

2024-10-22 16:45:00 1281

原创从零开始手把手带你训练LLM保姆级教程，草履虫都能学会！零基础看完这篇就足够了~

ChatGPT面世以来，各种大模型相继出现。那么大模型到底是如何训练的呢，在这篇文章中，我们将尽可能详细地梳理一个完整的 LLM 训练流程，包括模型预训练（Pretrain）、Tokenizer 训练、指令微调（Instruction Tuning）等环节。

2024-10-22 12:07:17 963

原创 ChatGLM4重磅开源! 连忙实操测试一波，效果惊艳，真的好用！附带最新相关资料和喂饭级实操推理教程！！

GLM4重磅开源啦GLM4系列版本介绍GLM4大模型能力测评结果经典测评任务结果长文本能力工具调用能力多模态能力手把手实操GLM-4-9B-Chat推理预测&&效果展示GLM4运行硬件和环境要求配置对应的库环境使用peft+bitsandbytes 进行4位量化推理进行大模型的推理显存占用情况手把手实操多模态版本GLM-4V-9B-Chat推理预测&&效果展示多模态GLM-4V-9B对应的硬件资源进行4位量化加载准备测试图片进行推理预测参考文档GLM-4-9B是智谱AI在24年6月5日推出的开源预训练模型

2024-10-22 12:04:08 893

原创大模型LLM学习路线图2024年最新版！全面掌握学习路径，非常详细，零基础想学大模型收藏这一篇就够了

ChatGPT的出现在全球掀起了AI大模型的浪潮，2023年可以被称为AI元年，AI大模型以一种野蛮的方式，闯入你我的生活之中。从问答对话到辅助编程，从图画解析到自主创作，AI所展现出来的能力，超出了多数人的预料，让不少人惊呼：“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。

2024-10-22 11:44:49 918

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-10-20 12:30:00 1032

原创大模型LLM学习路线图2024年最新版！全面掌握学习路径，非常详细，零基础想学大模型收藏这一篇就够了

ChatGPT的出现在全球掀起了AI大模型的浪潮，2023年可以被称为AI元年，AI大模型以一种野蛮的方式，闯入你我的生活之中。从问答对话到辅助编程，从图画解析到自主创作，AI所展现出来的能力，超出了多数人的预料，让不少人惊呼：“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。

2024-10-19 15:56:33 1125

原创大模型LLM学习路线图2024年最新版！全面掌握学习路径，非常详细，零基础想学大模型收藏这一篇就够了

ChatGPT的出现在全球掀起了AI大模型的浪潮，2023年可以被称为AI元年，AI大模型以一种野蛮的方式，闯入你我的生活之中。从问答对话到辅助编程，从图画解析到自主创作，AI所展现出来的能力，超出了多数人的预料，让不少人惊呼：“未来是属于AI的”。AI大模型——成为互联网从业者必备技能。

2024-10-17 18:30:51 1047

原创【AI大模型】应用开发基础，学到就是赚到！零基础入门到精通，看完这篇就足够了~

1、了解大模型能做什么2、整体了解大模型应用开发技术栈3、浅尝OpenAI API的调用AI全栈工程师：懂AI、懂编程、懂业务的超级个体，会是AGI（Artificial General Intelligence 通用人工智能）时代最重要的人。

2024-10-17 18:26:00 789

原创【AI大模型】羊驼大模型详解_零基础入门到精通，看完这篇就足够了~

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。原生的基础LLaMa用的语料是通用语料。微调的本质并不是能把模型效果变好，微调的目的是让模型更适应于我们的数据。作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。国内很多大模型都是学Alpaca模型的玩法，套壳LLaMA模型低成本训练出自己的模型。

2024-10-16 13:47:24 889

空空如也

空空如也