自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 大数据最新大模型学习路线与建议_大模型学习路径

不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!LLaMA 系列模型核心原理详解(LLaMA/Alpaca/Vicuna/BaiChuan/LLaMA2/BaiChuan2)GPT 系列模型核心原理详解(GPT1/GPT2/GPT3/GPT4/InstructGPT)ChatGLM 系列模型核心原理详(ChatGLM/ChatGLM2)BLOOM 系列模型核心原理详解(BLOOM/BLOOMZ)

2024-07-23 16:56:17 253

原创 Llama3微调教程:超简单,人人都可以打造属于自己的GPT!

本教程详细介绍了如何使用Unsloth和Google Colab环境对Llama 3进行微调。使用Colab基本上是无脑点击运行就好了。经过这个教程,我们发现微调模型主要有三个核心环节:数据准备,这一步决定了质量;模型训练,这一步硬件资源决定了时间;模型测试,因为我们初步体验,所以比较简略,后续可以进一步探讨。通过本教程,即使是AI领域的新手也能够掌握大模型的微调技术。Unsloth不仅降低了技术门槛,也为个人和小团队提供了强大的工具。如果还有问题,可以查看我的notebook或者进群讨论。

2024-07-23 14:12:29 394

原创 如何用大模型+知识库打造微信群里的AI问答神器!

想象一下,你的微信群或公众号中,有一个AI问答专家随时待命,帮助你和你的朋友们解答各种问题,是不是很酷?首先,确保你有一个Python环境。这就像是我们的魔法工坊,所有的魔法都从这里开始。接着是我们的主角——chatgpt-on-wechat。这个项目就像是我们的魔杖,帮助我们在微信世界中施展魔法。我们需要连接到具有API接口的各种大型语言模型。你可以把它们想象成我们的魔法书,里面充满了知识和智慧。最后,我们的知识库,它是基于LinkAI构建的。这就像是我们的魔法药水,给我们的问答专家提供了额外的力量。

2024-07-23 13:53:50 476

原创 想转行AI大模型开发但不知如何下手?拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2024-07-22 13:48:51 747

原创 想转行AI大模型开发但不知如何下手?拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2024-07-15 11:01:12 826

原创 大语言模型 (LLM)是什么_

2023年,让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型(Large Language Model)”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处,能够结合上下文,像人一样有逻辑性地回答问题,就算生成超长的文本也不会跑偏。)是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率,通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。

2024-07-11 10:41:55 335

原创 渗透实战:内网域渗透_内网渗透实例

本文记录了一次针对具有二层内网的域环境进行渗透测试的过程,文中涉及了内网域渗透的基本方法、思路和技巧。交替使用了msf、CobaltStrike、frp、chisel、SharpSQLTools等工具,最后通过约束委派拿下了域控。其间运用了很多小工具,文章较长,下面开始此次渗透长途之旅。

2024-07-11 10:41:05 284

原创 网站渗透这块水太深,你把握不住!但你叔我能(十年经验分享)

国内其实正经开设网络安全专业的学校很少,大部分同学是来自计算机科学、网络工程、软件工程专业的,甚至很多非计算机专业自学的。因此不像这三个专业,有系统的课程体系,大一教什么,大二教什么,大三又教什么,那么清晰明白,网络安全这条路很多都是自学摸索。我从大二开始入坑网络安全,至今也有十个年头了,也见过许许多多自学成才的例子,工作这些年,先后学习过C、C++、Java、Python、Objective-C、JavaScript、TypeScript,现在回过头来,有一些自己的思考。

2024-07-04 14:45:30 772

原创 2024年AIGC行业研究:多模态大模型与商业应用

2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大量数据训练而成的人工智能系统,可根据用户的个性化指令生成文本、音频、图像、代码等内容。自2022年频频出圈的ChatGPT推出以来,生成式AI在游戏、影视、出版、金融、数字人等多个应用场景中展现出巨大潜力和价值。

2024-07-01 14:07:27 956

原创 想转行AI大模型开发但不知如何下手?拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2024-06-29 14:48:06 621

原创 聊一聊国内大模型公司面经和感受

这段时间面试了很多家,也学到了超级多东西。楼主这边背景是做基座预训练算法端为主的,对框架端和RL的内容有一定了解(面试能凑合),对于后端的知识比如ML compiler,kernel,cuda相关的了解就比较浅了(问到觉大概率挂)。硬件几乎不太懂。感觉一圈聊下来几点感悟:大模型这方向真的卷,面试时好多新模型,新paper疯狂出,东西出的比我读的快。Research岗位对工程也有要求,工程端也需要了解模型。感觉比较硬核的岗位,尤其初创公司都是对好几个点都有要求的(应用,模型,框架,底层后端,硬件)。

2024-06-20 17:49:24 645

原创 大模型技术工程师:抓住时代机遇,成为行业精英_

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

2024-06-20 10:23:34 876

原创 小白也能看懂 大模型的6个评估指标_大模型生成质量评估标准

近年来,随着深度学习技术的飞速发展,大型神经网络模型如BERT、GPT-3等已经成为自然语言处理、计算机视觉、语音识别等领域的重要工具。这些模型之所以称为"大型",是因为它们通常包含数十亿甚至数千亿的参数,比以往的模型要庞大得多。然而,模型的规模庞大并不总是意味着性能更好,因此我们需要一套有效的方法来评估这些大型神经网络的性能。本文将探讨为什么要评估大型神经网络模型,以及如何使用一系列关键指标来评估它们。在深度学习领域,大型神经网络模型已经成为各种应用的核心。

2024-06-19 13:49:58 724

原创 大模型技术工程师:抓住时代机遇,成为行业精英_

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

2024-06-19 13:47:20 791

原创 大模型技术工程师:抓住时代机遇,成为行业精英_

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

2024-06-19 13:46:31 963

原创 大模型太贵?一直都这样,找找自己的原因好吧?

什么?炼个大模型还嫌贵?到底哪里贵了!??争先恐后训练大模型,搞得现在“算力慌”“一卡难求”,算力当然水涨船高了!“特供版”GPU又贵又缩水,大家自己愿意当“冤大头”囤卡,还好意思埋怨贵了?这么多年有没有认真工作?为什么这么多算力还依赖进口!自己为什么不能制造芯片?有没有在自主化上想想办法?数据需要存,接入AI模型需要网,部署AI模型需要终端。哪个不需要投入了!任何一个地方出现短板,就会出现木桶效应!加一加算一算,当然不便宜了!有时候找找自己的原因!综合成本那么高,

2024-06-19 13:44:28 757

原创 想转行AI大模型开发但不知如何下手?拥有他让你抢先一步

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2024-06-19 10:50:18 778

原创 AI大模型入门到精通,收藏这一篇就够了!

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。

2024-06-19 10:20:21 622

原创 大模型技术工程师:抓住时代机遇,成为行业精英_

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

2024-06-18 10:13:20 343

原创 神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!

对于很多挑战性的任务,使用大模型能够大大减轻程序设计的负担,从而显著提高项目的质量。这里,我为大家分享一份完整的大模型学习资料,希望能帮助那些想要学习大模型的小伙伴们。但通过学习大模型,你可以不断提升自己的技术能力,开拓视野,甚至可能发现一些自己真正热爱的事业。虽然大模型在底层运算上可能不如一些特定的算法快速,但大模型清晰的结构和强大的能力能够解放开发者的大量时间,同时也能方便地与其他技术(如传统机器学习算法)结合使用。大模型的学习不仅能够提升你的技术能力,还能够帮助你更好地理解数据科学和人工智能的原理。

2024-06-18 09:57:57 314

原创 大模型太贵?找找自己的原因好吧?

什么?炼个大模型还嫌贵?到底哪里贵了!??争先恐后训练大模型,搞得现在“算力慌”“一卡难求”,算力当然水涨船高了!“特供版”GPU又贵又缩水,大家自己愿意当“冤大头”囤卡,还好意思埋怨贵了?这么多年有没有认真工作?为什么这么多算力还依赖进口!自己为什么不能制造芯片?有没有在自主化上想想办法?数据需要存,接入AI模型需要网,部署AI模型需要终端。哪个不需要投入了!任何一个地方出现短板,就会出现木桶效应!加一加算一算,当然不便宜了!有时候找找自己的原因!综合成本那么高,

2024-06-17 10:21:57 315

原创 AI打造“魔法博物馆”,五分钟完成一件“3D展品”

注意看,这是一家“魔法博物馆”,陈列的展品琳琅满目,甚至还有机甲套装……魔法镜子、水晶法杖……也是一应俱全,仿佛真的进入了魔法世界。没错,这个“博物馆”里的“展品”全都是由AI打造的,而且一件只需要五分钟。来自南洋理工大学、上海AI实验室等机构的研究人员,共同推出了新款文生3D基础模型。只需要一组文本,它就可以在5分钟内生成出多样化、高精度的3D模型。除了“魔法博物馆”里的展品之外,日常的物品3DTopia更是可以精准合成。

2024-06-17 10:11:06 907

原创 一张图看懂大模型性价比:能力、价格、并发量全面PK

百度最强模型的价格不变,但轻量模型把“厘时代”直接打到免费。不过需要注意的是,根据文心一言官网介绍,ERNIE Speed模型适用于精调,而精调还是要收费的。阿里云的模型全线降价,最强模型降幅低,轻量模型降幅高。所有价格应该都是经过了精密的测算,不会是随意拍的数。从价格来看还是颇有诚意,但初始支持的TPM/RPM稍显不足,企业在实际使用中需要对相关权益做好沟通。字节,火山引擎。当我们说起价格那些事儿,不由想起《明朝那些事儿》的经典台词:要么不做,要么做绝。

2024-06-17 09:46:42 354

原创 如何计算 GPT 的 Tokens 数量?

随着人工智能大模型技术的迅速发展,一种创新的计费模式正在逐渐普及,即以“令牌”(Token)作为衡量使用成本的单位。那么,究竟什么是Token呢?Token 是一种将自然语言文本转化为计算机可以理解的形式——词向量的手段。这个转化过程涉及对文本进行分词处理,将每个单词、汉字或字符转换为唯一的词向量表示。通过计算这些词向量在模型中的使用次数,服务提供商就能够量化用户所消耗的计算资源,并据此收取费用。需要注意的是,不同的厂商可能采用不同的方式来定义和计算 Token。

2024-06-17 09:44:10 515

原创 【劲爆消息】GLM4 开源了!!!人工智能大模型又一大进步

在人工智能领域,开源项目总是能够激发社区的创新活力。今天,我们要分享一个令人震撼的消息:智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本——GLM-4-9B,现已全面开源!GLM-4-9B 不仅仅是一个模型,它是智谱 AI 对深度学习和自然语言处理能力的一次全新探索。在语义理解、数学推理、代码执行等多个领域,GLM-4-9B 展现出了超越 Llama-3-8B 的卓越性能。

2024-06-16 14:00:00 560

原创 一文搞定 大语言模型(LLM)微调方法

众所周知,大语言模型(LLM)正在飞速发展,各行业都有了自己的大模型。其中,大模型微调技术在此过程中起到了非常关键的作用,它提升了模型的生成效率和适应性,使其能够在多样化的应用场景中发挥更大的价值。那么,今天这篇文章就带大家深入了解大模型微调。其中主要包括什么是大模型微调、什么时候需要大模型微调、大模型微调方法总结、大模型微调最佳实践等。在介绍大模型微调方法之前,首先带大家了解一下大语言模型的项目生命周期,它大致可以分为以下几个步骤,如下图所示:首先,明确项目目标。

2024-06-15 14:44:47 893

原创 小白也能看懂 大模型的6个评估指标_大模型生成质量评估标准

近年来,随着深度学习技术的飞速发展,大型神经网络模型如BERT、GPT-3等已经成为自然语言处理、计算机视觉、语音识别等领域的重要工具。这些模型之所以称为"大型",是因为它们通常包含数十亿甚至数千亿的参数,比以往的模型要庞大得多。然而,模型的规模庞大并不总是意味着性能更好,因此我们需要一套有效的方法来评估这些大型神经网络的性能。本文将探讨为什么要评估大型神经网络模型,以及如何使用一系列关键指标来评估它们。在深度学习领域,大型神经网络模型已经成为各种应用的核心。

2024-06-15 14:44:16 540

原创 带你了解火遍全网的“AI大模型”看完这篇就够了~

在聊到AI的时候,我们都离不开“大模型”这三个字。百度李彦宏说 :大模型改变世界;360周鸿祎说:大模型是新时代“发电厂”;李开复博士说:AI大模型是不能错过的历史机遇;……那么,究竟什么是大模型?今天我想和你深度聊聊,欢迎和我链接,一起探讨大模型的更多可能性。

2024-06-15 14:12:11 1014

原创 吴恩达熬夜手写‘大模型学习笔记‘也就让我月薪涨3k

1.限制字数。2.明确总结的目的。比如对于一段消费者评论,作为商家,可以提示模型总结的目的是帮助物流部分优化,这样模型输出结果会更关注产品物流。3.同时总结多条文本。

2024-06-15 14:11:40 849

原创 大语言模型 (LLM)是什么_

2023年,让整个人类最为振奋的AI技术就是ChatGPT。“大语言模型(Large Language Model)”这个词也随之映入人们的眼帘。ChatGPT让人觉得惊艳之处,能够结合上下文,像人一样有逻辑性地回答问题,就算生成超长的文本也不会跑偏。)是一种机器学习算法,它可以根据给定文本来预测下一个词语或字符的出现的概率,通过大量的文本数据来学习语言的统计特征,进而生成具有相似统计特征的新文本。

2024-06-15 14:10:19 878

原创 【劲爆消息】GLM4 开源了!!!人工智能大模型又一大进步

在人工智能领域,开源项目总是能够激发社区的创新活力。今天,我们要分享一个令人震撼的消息:智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本——GLM-4-9B,现已全面开源!GLM-4-9B 不仅仅是一个模型,它是智谱 AI 对深度学习和自然语言处理能力的一次全新探索。在语义理解、数学推理、代码执行等多个领域,GLM-4-9B 展现出了超越 Llama-3-8B 的卓越性能。

2024-06-15 11:12:42 497

原创 2024迎来裁员大潮,这个新方向却月薪10w+,这么豪横?

要说24年一定最热的技术,!前段时间阿里旗下的开源项目,登上GitHub热榜!AI大热,如今的优异表现,必然会出现各种细分场景应用的工具软件,和大量岗位项目!山雨欲来风满楼,,所有科技公司已经开始此领域的人才。算法的岗位,近!这件事在HR届也是相当震撼的。目前的市场,!甚至同属AI边缘岗都比其他岗!与此同时,,竞争激烈,好公司核心岗位不用说,谁都想去。所以事实就是,想要上岸,门槛也逐渐变高,。为了能够学习到真正在。

2024-06-14 17:28:35 435

原创 2024年AIGC行业研究:多模态大模型与商业应用

2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。这一突破再次将AIGC推向大众视野。AIGC即通过大量数据训练而成的人工智能系统,可根据用户的个性化指令生成文本、音频、图像、代码等内容。自2022年频频出圈的ChatGPT推出以来,生成式AI在游戏、影视、出版、金融、数字人等多个应用场景中展现出巨大潜力和价值。

2024-06-14 17:19:15 1313

原创 带你了解火遍全网的“AI大模型”看完这篇就够了~

在聊到AI的时候,我们都离不开“大模型”这三个字。百度李彦宏说 :大模型改变世界;360周鸿祎说:大模型是新时代“发电厂”;李开复博士说:AI大模型是不能错过的历史机遇;……那么,究竟什么是大模型?今天我想和你深度聊聊,欢迎和我链接,一起探讨大模型的更多可能性。

2024-06-14 17:16:01 654

原创 LLM(大语言模型)深度解析

语言建模的研究始于20世纪90年代,最初采用了统计学习方法,通过前面的词汇来预测下一个词汇。然而,这种方法在理解复杂语言规则方面存在一定局限性。随后,研究人员不断尝试改进,其中在2003年,深度学习先驱Bengio在他的经典论文《A Neural Probabilistic Language Model》中,首次将深度学习的思想融入到语言模型中,使用了更强大的神经网络模型,这相当于为计算机提供了更强大的“大脑”来理解语言。这种方法让模型可以更好地捕捉语言中的复杂关系,虽然这一步很重要,但仍有改进的空间。

2024-06-14 10:25:22 1360

原创 AI大模型入门基础教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。

2024-06-14 10:20:48 543

原创 2024年最新Stable Diffusion下载+安装+使用教程(超详细版本),收藏这一篇就够了!

本文将基于最新的SD整合包,结合笔者整合的资源,为大家介绍最基础的概念和安装方式。可以说,从这一天开始,AI绘画,尤其是SD的普及,又得到了更进一步的推动。

2024-06-14 10:16:33 1201

原创 借助ChatGPT快速仿写一篇优质论文,无痛仿写、完美创作(看完这篇就够了)

最后一步就是关键的实践仿写了,我们可以利用ChatGPT进行初稿学术写作。ChatGPT可以根据我们提供的主题和结构,生成论文的草稿,我们再根据需要进行修改和完善。在这个过程中,ChatGPT不仅是一个写作助手,更是一个思维激发者,辅助在写作中不断探索和创新。

2024-06-13 11:47:57 1024

原创 【AIGC调研系列】AIGC+Jmeter实现接口自动化测试脚本生成

AIGC(人工智能生成内容)结合JMeter实现接口自动化测试脚本生成的方法,主要涉及到通过流量收集工具和AIGC技术获取用户操作接口数据,并利用这些数据生成自动化测试脚本的过程。这种方法可以有效提高软件测试的效率和质量[1]。JMeter是一个开源的负载测试工具,能够模拟多种协议和应用程序的负载,包括HTTP、FTP、SMTP等[3][14]。它可以帮助快速构建测试用例,模拟多种场景,发现接口的性能问题[14]。

2024-06-12 18:05:44 933

原创 【AIGC】OpenAI推出王炸级模型sora,颠覆AI视频行业

2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。刚刚发布的google的Gemini pro 1.5就一下子变得无人问津了,太尴尬了。OpenAI Sora是一种结合了Diffusion模型和Transformer模型的技术。

2024-06-11 14:24:32 1017

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除