从单词到向量-自然语言处理NLP

最新推荐文章于 2022-11-28 19:51:42 发布

一起捉水母

最新推荐文章于 2022-11-28 19:51:42 发布

阅读量1k

点赞数

分类专栏： NLP 文章标签： NLP 深度学习机器学习软件开发

原文链接：https://towardsdatascience.com/word-to-vectors-natural-language-processing-b253dd0b0817

版权

-译文，原文链接：Word to Vectors — Natural Language Processing

为什么NLP比较难?

计算机以清晰、准确并且通常是结构化的程序语言与人类交互。然而，人类的语言通常不是那么清晰。有同义词、反义词、反义词还有一些单词在用做名词和动词会表现出不同的含义。这些字词在自然语言中具有上下文相关的意义，人类可以理解和区分它们，而机器则不能。这就是使NLP成为AI中最困难，最有趣的任务之一的原因。

使用NLP可以完成什么工作？

通过使计算机能够“理解”人类语言，可以完成一些任务。我在本文中用于检测拼写和语法的应用就是一个实例。下面这些任务也是NLP正在研究的：

拼写和语法检测
同义词反义词的寻找
从文档和网站提取信息
理解语句、文档的信息
机器翻译（例如从英语到德语的翻译）
回答问题和完成任务（例如安排日程）

如何标识单词？

首先，我们要能够将单词作为机器学习模型的输入，一种表示单词的数学方法是将其表示为向量。英文中大约共有1300万单词，但是他们中的很多是相关的，比如spouse和partner，hotel和motel。所以我们是否有必要为1300万个单词分别使用向量表示？
当然不是，我们必须寻找一个远小于1300万的并且足以编码语言中的所有语义的N维向量空间。我们必须对单词

最低0.47元/天解锁文章

一起捉水母

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
从单词到向量-自然语言处理NLP

-译文，原文链接：Word to Vectors — Natural Language Processing为什么NLP比较难?计算机以清晰、准确并且通常是结构化的程序语言与人类交互。然而，人类的语言通常不是那么清晰。有同义词、反义词、反义词还有一些单词在用做名词和动词会表现出不同的含义。这些字词在自然语言中具有上下文相关的意义，人类可以理解和区分它们，而机器则不能。这就是使NLP成为AI中最...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。