深度理解机器学习5-词性标注的应用

最新推荐文章于 2023-03-12 16:25:54 发布

五百五。

最新推荐文章于 2023-03-12 16:25:54 发布

阅读量1.1k

点赞数 1

分类专栏：深度学习文章标签：人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/clayhell/article/details/128812565

版权

深度学习专栏收录该内容

45 篇文章 2 订阅

订阅专栏

词性标注的应用

就像文本预处理技术通过鼓励机器只关注重要的细节来帮助机器更好地理解自然语言一样，词性标注帮助机器实际解释文本的上下文，从而理解它。虽然文本预处理更像是一个清理阶段，词性标注实际上是机器开始输出有关语料库的有价值信息的部分。

机器以多种方式处理自然语言：·词性标注有助于区分同音异义词——拼写相同但含义不同的词。例如，单词“play”可以指进行活动时的动词，也可以指将在舞台上表演的戏剧作品中的名词。词性标注器可以通过确定词性标注来帮助机器理解单词“play”在什么上下文中使用。·词性标注建立在句子和分词需求的基础上，这是自然语言处理的基本任务之一。·词性标注被其他算法用于执行更高级别的任务，我们将在本章讨论命名实体识别。·词性标注也有助于情感分析和问题回答的过程。

词性标注的类型

词性标注器可以是有监督学习类型和无监督学习类型。

1.基于规则的词性标注器

这些词性标注器的工作方式几乎和它们的名字一样——按照规则。给标注器一组规则的目的是确保它们在大多数情况下准确地标记一个模棱两可或未知的单词，因此大多数规则仅在标注器遇到模棱两可或未知的单词时才适用。

2.随机的词性标注器

随机词性标注器是使用除了基于规则的方法之外的任何方法来给单词指定标注的标注器。因此，有许多方法属于随机范畴。当确定单词的词性标注时，所有结合统计方法（如概率和频率）的模型都是随机模型。

1）单位法或词频法

最简单的随机词性标注器仅根据一个单词与一个标签一起出现的概率将词性标注分配给模棱两可的单词。这基本上意味着，标注器在训练集中发现的与某个单词最常链接的任何标注，都会被分配给同一个单词的模糊实例。

2）n元法

这基于前面的方法。名称中的n代表在确定一个单词属于特定词性标注的概率时要考虑多少个单词。在单位标注器中，n=1，因此只考虑单词本身。增加n值会导致标注器计算n个词性标注的特定序列一起出现的概率，并基于该概率为单词分配标签。

3）隐马尔可夫模型

隐马尔可夫模型结合了词频法和n元法。马尔可夫模型是描述一系列事件或状态的模型。每种状态发生的概率仅取决于前一事件所达到的状态。这些事件基于观察。隐马尔可夫模型的“隐藏”方面是事件可能隐藏的一组状态。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度理解机器学习5-词性标注的应用

词性标注的应用
复制链接

扫一扫

专栏目录

五百五。 CSDN认证博客专家 CSDN认证企业博客

码龄5年

大连交通大学

177: 原创

104万+: 周排名

27万+: 总排名

21万+: 访问

: 等级

2124: 积分

245: 粉丝

290: 获赞

52: 评论

1518: 收藏

私信

关注

热门文章

分类专栏

Redis 7篇
QT 15篇
linux 1篇
游戏 1篇
c++入门 18篇
c++语言特性 23篇
算法基础 1篇
计算机基础 1篇
网络 2篇
c++面试 7篇
TCP/IP 7篇
OpenGL 1篇
docker 1篇
CMAKE 3篇
yolov5 2篇
设计模式 14篇
小白大牛漫话c++ 7篇
深度学习 45篇
牛客刷题 19篇
编程小技巧 1篇

最新评论

c++二叉树遍历
2303_81492929: preOrderIterative函数，得用啥定义啊
c++详解之右值引用
yslhk1982: 个人感觉main函数的有值引用部分： // 传递一个右值给 func() func(MyString("Hello, rvalue!")); 应该改为： func(MyString(move(str))); 否则虽然调用了右值引用的重载函数，但是重载函数没有调用到对象的右值构造函数上，还是调用MyString对象的左值引用的构造函数。个人见解，不一定对，望赐教！
学会吊打面试官之underedmap
阿J~: 很详细呀感谢老哥分享！
三次握手详解，全网最全
不独入寝可成梦: 第三次握手不是可以携带数据吗？
c++二叉树遍历
磁铁小破孩: 支持博主优质文章，讲解的非常详细，干货满满，通俗易懂，希望博主也能来我博客指导一番

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五百五。 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。