语言表征模型

最新推荐文章于 2023-03-25 17:15:04 发布

huang_yx005

最新推荐文章于 2023-03-25 17:15:04 发布

阅读量771

点赞数

分类专栏：深度学习文章标签：自然语言处理深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huang_yx005/article/details/122488448

版权

深度学习专栏收录该内容

2 篇文章 1 订阅

订阅专栏

语言表征模型的概述：

将自然语言中的语言单元（如字、词、character、subword等）中的语义压缩到低维的、紧实的向量空间中。一般采用预训练的方法。得到语言表征模型后再用于其他下游任务。

例如：

word embeding模型：

BERT模型：

BERT:

Bidirection Encoder Representation from Transformer

论文链接：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

官方代码和预训练模型： https://github.com/google-research/bert

采用masked language model(MLM)方法

语言表征模型与语言模型的区别：

语言模型的用途是更具体的任务，即输出语言单元序列的概率，或者说不同的字、词能组合成一个句子的概率。

语言表征模型不针对具体的任务，仅仅是学习到语言单元的表达向量。这些表达向量要用在什么地方是由下游人物决定的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语言表征模型

语言表征模型的概述：将自然语言中的语言单元（如字、词、character、subword等）中的语义压缩到低维的、紧实的向量空间中。例如：word embeding模型：BERT模型：语言表征模型与语言模型的区别：语言模型的用途是更具体的任务，即输出语言单元序列的概率，或者说不同的字、词能组合成一个句子的概率。语言表征模型不针对具体的任务，仅仅是学习到语言单元的表达向量。这些表达向量要用在什么地方是由下游人物决定的。...
复制链接

扫一扫

专栏目录

博客等级

码龄16年

147
原创

41
点赞

147
收藏

20
粉丝

关注

私信

热门文章

分类专栏

学习笔记 8篇
深度学习 2篇
前端 3篇
产品经理 12篇
C++ 69篇
ThinkPhp 2篇
QNX 4篇
Liunx 18篇
Python 8篇
Tools 28篇
开源项目 2篇
MxNet 2篇
自然语言处理 8篇
TensorFlow 7篇
Android 6篇
ASR 5篇

最新评论

conda与pip
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)增加条理清晰的目录；(3)使用更多的站内链接。
GDB相关
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)增加条理清晰的目录；(3)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)。
bazel使用问题汇总
追求上进的小小白: Error: file '@bazel_tools//tools/cpp:toolchain_utils.bzl' does not contain symbol 'use_cpp_toolchain' (did you mean 'find_cpp_toolchain'?)博主，请问这个问题有见过吗？应该如何解答呢？求解。。。谢谢
运营之光2.0 我的互联网运营方法论与自白
Rex~: 看来我还有好长的技术路要走啊！
运营之光2.0 我的互联网运营方法论与自白
梦想橡皮擦: 原创不易，继续加油

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。