自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基于含注意力机制的编码器—解码器的机器翻译

编码器负责理解并捕获输入序列的语义信息,通常由一个或多层循环神经网络(RNN模型,如LSTM或GRU)构成,也可以是Transformer等结构。输入序列按照时间步(或单词顺序)依次输入编码器,编码器在每次时间步都会更新其内部状态,最终输出一个固定长度的上下文向量(Context Vector)或一系列上下文向量(在使用双向RNN时会有前后向两个方向的信息),这个向量包含了输入序列的整体信息。

2024-06-29 22:39:32 406

原创 基于Transformer实现机器翻译(日译中)

1.有gpu的可以用自己电脑跑,记得装对pytorch版本,否则用不了gpu。我电脑是3060,跑一轮大概1600s左右2.没有gpu可以用云平台跑,我用的是矩池云,直接租用一个服务器,然后选择JupyterLab,打开,导入代码,导入相应文件,pip install要用到的包就行了。

2024-06-29 19:45:20 398

原创 NLP实验——基于MLP的姓氏分类

MLP是最简单的神经网络,有一个输入层和输出层,最少有一个隐藏层,每个层之间的神经元是全连接的。个人理解MLP是f(wx+b)的多层嵌套来表征或拟合复杂关系,其中f为激活函数,有了激活函数MLP才有处理非线性问题的能力,否则无论多少层,多少节点都将归结为wx+b。

2024-06-09 23:19:29 299

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除