深度学习
文章平均质量分 63
记录与深度学习有关的典型任务、模型结构、训练trick、发展过程、框架
huang_yx005
这个作者很懒,什么都没留下…
展开
-
pytorch源码编译
下载源代码和依赖库 需要在内部隔离网络中从源码编译pytorch,但内部网络无法链接github。且pytorch依赖库众多,一个一个地下载依赖库不太现实。 我采用的方法是:在外部可联网的机器上git clone pytorch源码,切换到所需的branch或者tag上。使用命令git submodules update --init --recursive下载所有的依赖库。这一步非常耗时,也可能会失败,需要反复执行该命令,直到没有报错了,所有的依赖库才算都下载了。注意一定要加上 --recursive,因原创 2022-05-12 11:06:17 · 4176 阅读 · 0 评论 -
语言表征模型
语言表征模型的概述: 将自然语言中的语言单元(如字、词、character、subword等)中的语义压缩到低维的、紧实的向量空间中。 例如: word embeding模型: BERT模型: 语言表征模型与语言模型的区别: 语言模型的用途是更具体的任务,即输出语言单元序列的概率,或者说不同的字、词能组合成一个句子的概率。 语言表征模型不针对具体的任务,仅仅是学习到语言单元的表达向量。这些表达向量要用在什么地方是由下游人物决定的。 ...原创 2022-01-14 10:19:50 · 815 阅读 · 0 评论