自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 Datawhale AI 夏令营+“AI+逻辑推理”方向Task01

本比赛旨在测试参与者的逻辑推理和问题解决能力。参与者将面对一系列复杂的逻辑谜题,涵盖多个领域的推理挑战。比赛内容涉及以下几个方面的背景知识:逻辑推理概念[1]:理解基本的逻辑推理概念,包括命题逻辑和谓词逻辑。熟悉如何从一组假设中得出结论,并能够识别和运用逻辑关系和规则。

2024-07-28 19:50:48 95

原创 Task03:Sora训练成片

6.资源紧张后续更新复现结果。3.训练 Sora 模型。

2024-03-15 00:20:59 322 1

原创 Task02:文生图片技术路径、原理与SD实战

3. Tokenizer中有一些特殊Token,比如开始和结束标记,你觉得它们的作用是什么?12. 请你将《LLM部分》中的一些设计(如RMSNorm)加入到《Self-Attention部分》的模型设计中,看看能否提升效果?5. RMSNorm的作用是什么,和LayerNorm有什么不同?5. Multi-Head Self-Attention,Multi越多越好吗,为什么?你知道几种Tokenize方式,它们有什么区别?8. Self-Attention的qkv初始化时,bias怎么设置,为什么?

2024-03-09 21:34:59 960

原创 Task01:Sora技术路径详解

Sora技术原理详解:ViT,Spacetime latent patches,扩散模型,Diffusion Transformer,DiT,

2024-03-01 00:09:43 574 1

原创 第 6 节 OpenCompass 大模型评测

OpenCompass,大模型评测

2024-02-18 21:44:09 344

原创 第 5 节 LMDeploy 大模型量化部署实践

LMDeploy,量化,推理,服务,TurboMind

2024-02-18 21:31:48 473

原创 第 4 节 XTuner 大模型单卡低成本微调实战

Finetune,XTuner,LLM

2024-02-18 21:06:00 343

原创 第 3 节 基于 InternLM 和 LangChain 搭建你的知识库

InternLM,LangChain

2024-02-18 20:41:41 433

原创 第 2 节 轻松玩转书生·浦语大模型趣味 Demo

书生·浦语大模型趣味 Demo:大模型,Agent ,InternLM,hugging face,ModelScopeOpenXLab

2024-02-13 00:40:18 529 1

原创 第 1 节 书生·浦语大模型全链路开源体系

书生·浦语大模型全链路开源体系:数据,预训练,微调,部署,评测,应用;书生·万卷,InternLM,XTuner,LMdeploy,OpenCompass,Lagent AgentLego

2024-02-08 23:13:37 492

原创 Task10:大模型之环境影响

大模型之环境影响:IT设备的生命周期评估,气候变化,碳排放量,全局系统考量,清洁能源数据中心,训练模型

2024-01-30 17:24:18 415 1

原创 Task09:大模型法律

大模型法律,版权法,知识产权法,许可,公平使用,隐私法,数据安全法,公平学习与机器学习,数据训练,模型生成。

2024-01-29 19:25:53 790

原创 Task08:大模型的危害性上&下

大模型的危害性:量化性能差异,社会偏⻅,有毒性,虚假信息;解决措施:测量与决策,注意事项与⽆提示实验,提示实验,减轻毒性,内容审查。

2024-01-28 21:09:10 577

原创 Task07:分布式训练

分布式训练,数据并行,模型并行,流水并行,混合并行,OneFlow 分布式训练,

2024-01-27 17:27:32 363

原创 Task06:大模型之Adaptation

大模型之Adaptation,Probing,Fine-tuning,Lightweight Fine-tuning,Prompt Tuning,Prefix Tuning,Adapter Tuning。

2024-01-25 22:39:37 499

原创 Task05:模型训练

模型训练,Decoder-only ,Encoder-only,Encoder-decoder,BART,T5,优化算法,随机梯度下降(SGD),Adam ,AdaFactor,混合精度训练,学习率,初始化

2024-01-23 23:53:07 721 1

原创 Task04:大模型的数据

大语言模型的数据,数据集,数据文档,数据生态

2024-01-21 21:28:52 460

原创 Task03:模型架构篇&新的模型架构篇

语言模型架构:分词技术和Transformer架构,混合专家和基于检索的模型

2024-01-20 23:34:17 594

原创 Task02:大模型的能力

大模型的能力,⾃然语⾔处理(NLP)基准测试,⼀些特殊的⼀次性演示,Language Modeling,Question answering,Translation,Arithmetic,News article generation,Novel tasksOther tasks

2024-01-16 21:50:52 544

原创 Task01:引言-大模型基础

语言模型的历史发展,基于的技术发展,未来面临的挑战。

2024-01-15 20:00:42 402

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除