一种全新的Word Embedding方法——Continuous Bag-of-Words (CBOW) 方法 Word Embeddings & Neural Networks for NLP

禅与计算机程序设计艺术

已于 2023-07-28 02:02:50 修改

阅读量1k

点赞数 1

分类专栏：大数据AI人工智能 LLM大模型落地实战指南文章标签：自然语言处理人工智能语言模型编程实践开发语言架构设计

于 2023-07-28 01:01:36 首次发布

本文链接：https://blog.csdn.net/universsky2015/article/details/131971512

版权

大数据AI人工智能同时被 2 个专栏收录

该专栏为热销专栏榜第27名

12192 篇文章 450 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

LLM大模型落地实战指南

4103 篇文章 19 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

作者：禅与计算机程序设计艺术

1.简介

1956年，麻省理工学院的克拉克·韦恩首次提出了“连接主义网络”(connectionist networks)的概念，其后经过十几年的发展，基于神经网络的机器学习技术日益成为主流。在这十年里，多种领域的研究者都涌现出来，推动着人工智能技术的不断进步。在语言识别、机器翻译等方面，人们对神经网络和深度学习的应用越来越关注，这也促使英特尔、微软、谷歌、Facebook、百度等科技巨头纷纷布局人工智能领域。近年来，随着语音识别技术的迅猛发展，端到端的语音识别系统正在形成。端到端的语音识别系统由声学模型、语言模型、语音合成三部分组成，传统的基于HMM/GMM的声学模型已经无法应付如今语音数据爆炸增长带来的巨大挑战。因此，出现了一种新型的端到端的语音识别系统——强化学习（Reinforcement Learning）+注意力机制（Attention Mechanism）。基于强化学习的语音识别器不需要事先知道系统的状态空间，而是在连续执行动作空间中寻找最佳方案。同时，由于注意力机制可以将注意力集中到需要关注的部分，避免对噪声或静音造成干扰，因此也具有很高的准确率。

2017年，加州大学洛杉矶分校的Thomas Schmidt教授，提出了一种全新的Word Embedding方法——Continuous Bag-of-Words (CBOW)。该方法通过考虑上下文来构建词向量，解决了传统词袋模型（Bag-of-Words Model）的一个重要缺陷，即它忽略了单词之间的关系。除了在语言建模方面取得了显著的突破之外，该方法还可以在很多语言理解任务上表现出色，如命名实体识别、文本分类、信息检索、语言模型等。在本文中，我们将介绍该方法的基本原理和原型

了解本专栏

超级会员免费看

禅与计算机程序设计艺术

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
8
评论
一种全新的Word Embedding方法——Continuous Bag-of-Words (CBOW) 方法 Word Embeddings & Neural Networks for NLP

1956年，麻省理工学院的克拉克·韦恩首次提出了“连接主义网络”(connectionist networks)的概念，其后经过十几年的发展，基于神经网络的机器学习技术日益成为主流。在这十年里，多种领域的研究者都涌现出来，推动着人工智能技术的不断进步。在语言识别、机器翻译等方面，人们对神经网络和深度学习的应用越来越关注，这也促使英特尔、微软、谷歌、Facebook、百度等科技巨头纷纷布局人工智能领域。近年来，随着语音识别技术的迅猛发展，端到端的语音识别系统正在形成。
复制链接

扫一扫