自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Datawhale AI夏令营 AI逻辑推理笔记

大语言模型,简称LLM。想象一下,如果有一个超级大脑能听懂你的话,还能跟你聊天、写故事、甚至帮你做决定,是不是很神奇?这就是LLM的魔力所在!话说回来,在过去的几年里,这些超级大脑们在各种各样的任务上都取得了惊人的进步。比如说,它们现在不仅能回答你关于天气的问题,还能帮你写出一篇关于气候变化的文章呢!而且,随着这些超级大脑变得越来越大(不是说它们真的会长成巨人哦),它们开始展现出了一些真正了不起的能力——推理能力!推理能力是什么呢?简单来说,就是能够理解一些基本的逻辑,然后根据这些逻辑去思考问题。

2024-08-02 20:59:05 884

原创 从baseline代码详解入门深度学习 Datawhale AI 夏令营

机器翻译任务的预处理是确保模型能够有效学习源语言到目标语言映射的关键步骤。预处理阶段通常包括多个步骤,旨在清理、标准化和转换数据,使之适合模型训练。

2024-07-17 23:47:19 693

原创 从baseline代码详解入门深度学习 Datawhale AI 夏令营

在机器翻译的发展进程中,译文质量评价有着非常重要的作用。解码器的结构基本上和编码器是一致的,在基于循环神经网络的翻译模型中,解码器只比编码器多了输出层,用于输出每个目标语言位置的单词生成概率,而在基于自注意力机制的翻译模型中,除了输出层,解码器还比编码器多一个编码­解码注意力子层,用于帮助模型更好地利用源语言信息。将句子分解成单词或词素(构成单词的基本组成部分,一个词素可以是一个完整的单词,也可以是单词的一部分,但每一个词素都至少携带一部分语义或语法信息),这是NLP中最基本的步骤之一。

2024-07-17 23:40:35 251

原创 Datawhale AI 夏令营 task1 笔记

早期的机器翻译系统主要采用基于规则的方法,这种方法依赖于语言学家编写的语法规则和词典进行翻译。统计机器翻译中最主流的方法包括基于词的统计机器翻译(Word-based MT)和基于短语的统计机器翻译(Phrase-based SMT),其流程一般包括预处理、句子对齐、词对齐、短语抽取、短语特征准备、语言模型训练等步骤。规则组织困难:为了应对多样的语言现象,语言学家们设计了规模庞大的句法规则,但这些规则难以有效组织,甚至会出现相互矛盾的情况。1. 基于规则的机器翻译(1950s-1980s)

2024-07-17 23:25:41 314

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除