- 博客(8)
- 收藏
- 关注
原创 Datawhale AI 夏令营 task2笔记
结构基本上和编码器是一致的,在基于循环神经网络的翻译模型中,解码器只比编码器多了输出层,用于输出每个目标语言位置的单词生成概率,而在基于自注意力机制的翻译模型中,除了输出层,解码器还比编码器多一个编码解码注意力子层,用于帮助模型更好地利用源语言信息。具体来说,给定源语言序列经过编码器输出的向量序列。由于 RNN 的循环过程在每个时间步都要求一个输入单词,为了启动解码过程,一般会使用一个保留的特殊符号 “[Start]” 作为翻译开始的标记送入到 RNN 解码器当中并解码出目标语言序列的第一个单词。
2024-07-15 19:25:22 1034
原创 Datawhale AI 夏令营 task1笔记
这种划分的主要目的是为了评估模型的性能并防止过拟合,确保模型具有良好的泛化能力。、机器翻译的发展可以追溯到20世纪50年代,经历了从基于规则的方法、统计方法到深度学习方法的演变过程。统计机器翻译中最主流的方法是基于词的统计机器翻译(Word-based MT)以及基于短语的统计机器翻译(Phrase-based SMT),总体上来看包含预处理、句子对齐、词对齐、短语抽取、短语特征准备、语言模型训练等步骤。基于提供的训练数据样本从多语言机器翻译模型的构建与训练,并基于测试集以及术语词典,提供最终的翻译结果。
2024-07-15 18:59:22 727
原创 Datawhale AI 夏令营 笔记1
后续需要仔细研究一下baseline代码,了解NLP模型的训练,完善提高模型性能。主要是跑通baseline,坑点在于需要很多次输入手机号,获取验证码。
2024-07-13 21:51:40 100
原创 BUAA-OO-Unit4总结
在前三个单元的学习过程中,我感觉在完成作业时,已经有涉及到正向建模的相关内容,只是没有严格遵循相关规范来完成。在本单元中,我们需要先根据指导书中描述的需求绘制出UML类图、状态图以及顺序图,确定好程序框架后再去编写相关代码。在完成本单元的作业时,我首先根据需要构建了Library类,将此类模拟成图书馆,再在其中构建所需的存储书籍的地点类,请求发送到Library中之后,在图书馆中发送给相应的地点处理请求。存储书籍的地点类一般都采用HashMap容器来存储书籍相关信息,以便于后续对书籍的存取操作。
2024-06-11 12:10:38 1690
原创 BUAA-OO-Unit3 总结
黑箱测试:其核心思想是将被测代码视为一个黑盒子,我们不关心其中的结构和实现细节,直接根据代码的需求和规格说明对其进行测试即可。黑盒测试的重点在于检查代码是否满足功能需求,这种方法的优点是与代码的具体实现分离,即使代码内部结构发生变化,只要外部行为不变,测试用例依然有效。白箱测试:白箱测试是一种基于代码的测试方法,与黑箱测试相反,白箱测试需要深入代码的内部结构和具体实现。测试者需要查看并理解源代码,设计测试用例来覆盖尽可能多的代码路径、分支、循环和条件,以确保代码的每一部分都经过了验证。
2024-05-16 14:25:31 731
原创 BUAA-OO-Uint1总结
x^3将processor处理后的表达式输入到Lexer中,Lexer通过next()方法解析表达式,再通过peek()方法将解析出的"词"传入Parser中。Parser对Lexer传出的curToken在进行分析,运用parseExpr()方法获得Expr、parseTerm()获得Term、parseFactor()获得Factor。expr包中类使用HashMap返回系数、指数到Poly中进行多项式计算。专门新建一个FunctAnalysis类用于对函数表达式的处理和转换。
2024-03-19 18:01:15 1681
原创 oopre总结
在后面的课程中,老师讲述了接口、父类和子类的概念,于是在之后的作业中,我根据老师所讲的概念,进行了第二次架构调整。我新加入了一个接口类:Commodity,其中带有四个方法,都是Bottle类、Equipment类、Food类和Adventurer类共同拥有的方法,我将这四个类都接在接口上,这样就避免了相同方法的重复。因此,我对Main类进行了调正,将其中所使用的方法、内容都整合压缩放到其他类中,这样使我的Main类非常整洁干净,同时减少了耦合。同时,我也对oo的课程设置有了一点初步的了解。
2023-11-04 11:10:00 70 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人