网易主观题-答案记录

最新推荐文章于 2022-06-14 21:23:32 发布

nameforcsdn

最新推荐文章于 2022-06-14 21:23:32 发布

阅读量394

点赞数 1

文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nameforcsdn/article/details/98236004

版权

根据要求对文本进行分类
（1）分类主要是运用机器学习或着深度学习技术根据不同类别数据的定义将数据分到不同的类别中。它可以解决人工标记数据的繁琐，也可以在信息检索、精确推荐等领域为社会带来便利。
（2）数据获取-》数据预处理-》特征工程-》数据集划分-》模型选择-》模型评估
（3）模型选择。文本分类较少使用传统的机器学习算法，因为需要人工从文本中提取特征，一方面人工提取到的特征较少，另一方面人工提取到的大部分是统计特征，不具有语义信息，所以大部分使用深度学习来进行建模。常用的深度学习模型有CNN、RNN、LSTM以及最近较流行的transformer等。一般对于类别区分较明显的数据可以使用CNN进行建模，且模型不需要太复杂；对于分类的类别数较多或者需要进行细粒度分类的数据，需要模型提取到更多的语义信息才会有较好的效果，所以一般使用多层的RNN及其变体，但RNN是一种序列模型，训练只能顺序进行，所以往往需要较长的训练时间，此外，虽然理论上RNN可以保留距离较远处的信息，但当文本较长时，RNN效果并不好。解决的方法，目前基于“Attention Is All You Need”这篇论文，许多学者研究出了self-attention机制，从而避免使用RNN，且可以更好的提取到文本语义信息。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
网易主观题-答案记录

根据要求对文本进行分类（1）分类主要是运用机器学习或着深度学习技术根据不同类别数据的定义将数据分到不同的类别中。它可以解决人工标记数据的繁琐，也可以在信息检索、精确推荐等领域为社会带来便利。（2）数据获取-》数据预处理-》特征工程-》数据集划分-》模型选择-》模型评估（3）模型选择。文本分类较少使用传统的机器学习算法，因为需要人工从文本中提取特征，一方面人工提取到的特征较少，另一方面人工提取...
复制链接

扫一扫

nameforcsdn CSDN认证博客专家 CSDN认证企业博客

码龄7年

3: 原创

63万+: 周排名

109万+: 总排名

1万+: 访问

: 等级

162: 积分

1: 粉丝

6: 获赞

2: 评论

9: 收藏

私信

关注

热门文章

分类专栏

最新评论

python获取当前文件路径
YaoV: [code=python] import os # import pandas as pd fileName=input('copy and paste your file name:') filePath=os.path.realpath(fileName) print(filePath) [/code]
python获取当前文件路径
YaoV: import os # import pandas as pd fileName=input('copy and paste your file name:') filePath=os.path.realpath(fileName) print(filePath) 老师麻烦看下为啥不对呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。