自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 MIT - The Missing Semester of Your CS Education 第1节The shell课程笔记和习题解答

Bourne Again SHell,简称bash。

2024-02-19 11:02:52 831 1

原创 MIT - The Missing Semester of Your CS Education 第2节Shell Tools and Scripting课程笔记和习题解答

使用bash作为脚本语言。

2024-02-19 10:57:32 1013 1

原创 MIT - The Missing Semester of Your CS Education 第3节Editors (Vim)课程笔记和习题解答

Vim 由一个位于~/.vimrc的文本配置文件(包含 Vim 脚本命令)。我们提供一个文档详细的基本设置,你可以用它当作你的初始设置。我们推荐使用这个设置因为它修复了一些 Vim 默认设置奇怪行为。在这儿下载我们的设置,然后将它保存成~/.vimrc花时间探索自定义选项是值得的。你可以参考其他人的在 GitHub 上共享的设置文件,比如,你的授课人的 Vim 设置 (AnishJon(usesneovim),Jose。

2024-02-19 10:52:28 734 1

原创 MIT - The Missing Semester of Your CS Education 第2节Shell Tools and Scripting课程笔记和习题解答

使用bash作为脚本语言。

2024-02-08 16:03:22 878 1

原创 在windows中使用linux

WSL(Windows Subsystrem for Linux) 是Windows自带的一个很好用的工具平台,可以将其视为是一种轻量级的虚拟机。在启用了WSL之后,就能在其下安装某个Linux发行版,例如Ubuntu。点击开始-设置-系统-可选功能-更多windows功能,勾选“适用于Linux的Windows子系统”和“虚拟机平台”,重新启动Windows。打开Microsoft Store,搜索Ubuntu。我选择了Ubuntu 22.04.3 LTS。我任意按了一个键,黑框框消失了。

2024-01-30 16:52:52 237 1

原创 MIT - The Missing Semester of Your CS Education 第1节The shell课程笔记和习题解答

Bourne Again SHell,简称bash。

2024-01-30 16:46:04 847 1

原创 记录复现过程A Simple Multi-Modality Transfer Learning Baseline forSign Language Translation

论文代码和Two-Stream Network for Sign Language Recognition是一样的。

2024-01-27 15:22:34 1446

原创 浅读A Simple Multi-Modality Transfer Learning Baseline for Sign Language Translation

这篇论文提出了一种简单的​迁移学习基线方法,用于手语翻译。现有的手语数据集(如PHOENIX-2014T、CSL-Daily)只包含大约10K-20K对手语视频、手语标注和文本,数量比训练口语翻译模型的平行数据少一个数量级。因此,数据是训练有效的手语翻译模型的瓶颈。为了缓解这个问题,我们提出了逐步从包含大量​外部监督的通用领域数据集到内部领域数据集进行预训练的模型。具体而言,我们在通用领域的人类动作数据集和内部领域的手语到手语标注数据集上对手语到手语标注的​视觉网络。

2024-01-27 14:41:46 938

原创 记录在服务器上配置环境的过程

本科小白记录在服务器上配置环境的过程ing。

2023-12-03 16:07:05 1468

原创 浅读Two-Stream Network for Sign Language Recognition and Translation

对于手语识别和翻译,大部分现有方法直接将RGB视频编码为隐藏表示。然而,RGB视频是具有大量视觉冗余的原始信号,导致编码器忽视手语理解所需的关键信息。为了解决这个问题并更好地融入领域知识,如手形和身体动作,我们引入了一个​双视觉编码器,其中包含两个独立的流来模拟原始视频和由现成的​关键点估计器生成的关键点序列。为了使这两个流之间相互作用,我们尝试了各种技术,包括​双向侧向连接​带辅助监督的手语金字塔网络和​帧级自蒸馏。

2023-12-03 15:53:04 955

原创 浅读Neural Sign Language Translation

手语识别(SLR)是过去两十年来一个活跃的研究领域。然而,迄今为止的大部分研究都将SLR视为一个简单的手势识别问题。SLR旨在识别连续手势的序列,但忽略了手语与口语之间丰富的语法和语言结构的差异。相反,我们引入了手语翻译(SLT)问题。在这里,目标是从手语视频中生成口语翻译,考虑到不同的词序和语法。我们在​神经机器翻译(NMT)框架下对SLT进行形式化,包括端到端和预训练设置(使用专业知识)。这使我们能够共同学习​空间表示、潜在的语言模型以及手语和口语之间的映射关系。

2023-12-03 15:48:10 909 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除