自然语言处理

最新推荐文章于 2024-02-01 10:22:21 发布

weixin_71097539

最新推荐文章于 2024-02-01 10:22:21 发布

阅读量126

点赞数

文章标签：自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_71097539/article/details/132817276

版权

自然语言的特点：词汇量大（关键词丰富）、非结构化、歧义性、容错性、易变性、简略性

一、简单知识介绍

1.自然语言处理的层次

1.语音，图像、文本

2.中文分词（词与词之间的边界）、词性标注（形容词、名词、动词等的标注）、命名体识别（专有名词，一般包括三大类（实体类、时间类和数字类）和七小类（人名、地名、机构名、时间、日期、货币和百分比））

3.信息抽取（information extraction），简称IE，即从自然语言文本中，抽取出特定的事件或事实信息，帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体（entity）、关系（relation）、事件（event）。信息抽取主要包括三个子任务：关系抽取(RE)、命名实体识别（NER）、事件抽取(EE)。

4.文本分类与文本聚类：两者区别为，文本分类为事先确定好的类别进行分类，文本聚类为无监督学习，没有确定的类别数量。

5.句法分析：句法分析分为两类，一类是分析句子的主谓宾定状补的句法结构。另一类是分析词汇间的依存关系，如并列从属比较递进等

6.语义分析与篇章分析

…………等其他综合性任务

2.机器学习

机器学习步骤：

1.数据预处理

2.特征提取（特征工程）

3.模型建立

4.进行训练

算法分类：监督学习，无监督学习，半监督学习

二、词典分词

1.词典

分词，词性标注，和命名实体识别，有什么区别？ - 知乎 (zhihu.com)

文本分类与文本聚类的区别_文本分类和文本聚类的区别_july_2的博客-CSDN博客

自然语言处理基础4 -- 句法分析 - 知乎 (zhihu.com)

weixin_71097539

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理

1.语音，图像、文本2.中文分词（词与词之间的边界）、词性标注（形容词、名词、动词等的标注）、命名体识别（专有名词，一般包括三大类（实体类、时间类和数字类）和七小类（人名、地名、机构名、时间、日期、货币和百分比））3.信息抽取（information extraction），简称IE，即从自然语言文本中，抽取出特定的事件或事实信息，帮助我们将海量内容自动分类、提取和重构。这些信息通常包括实体（entity）、关系（relation）、事件（event）。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。