《自然语言处理实战入门》---- 深度学习与中文短文本分析总结与梳理

最新推荐文章于 2024-06-28 18:53:42 发布

shiter

最新推荐文章于 2024-06-28 18:53:42 发布

阅读量2.2w

点赞数 13

分类专栏：自然语言处理实战入门【Generative AI重制版】文章标签：短文本

本文链接：https://blog.csdn.net/wangyaninglm/article/details/66477222

版权

自然语言处理实战入门【Generative AI重制版】专栏收录该内容

129 篇文章 254 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

1.绪论
2.短文本
- 2.1 短文本的研究范围
- 2.2 短文本特点
3.中文分词
4. 基于深度学习的短文本分析[参考2]
5.为什么深度学习如此有效？[参考1]
- 5.1主流深度学习模型对比
6.文本分类效果评价
7.短文本相关工具应用
8.主流分词工具对比分析
- 8.1 总体介绍
- 8.2 结巴和清华THULAC 介绍
9.最新短文本分析开源库分享
- 9.1多语言词向量 Python 库
参考文献
资源下载

1.绪论

过去几年，深度神经网络在模式识别中占绝对主流。它们在许多计算机视觉任务中完爆之前的顶尖算法。在语音识别上也有这个趋势了。而中文文本处理，以及中文自然语言处理上，似乎没有太厉害的成果？尤其是中文短文本处理的问题上，尚且没有太成功的应用于分布式条件下的深度处理模型？（大公司或许有，但没有开源）本文暂且梳理一下，尝试围绕深度学习和短文本处理的方方面面就最简单的概念进行一次梳理，并且试图思考一个问题：

深度学习处理中文短文本的最终效果是什么？

我思考后的答案是：

答：是一种模型，可以无需任何语言学知识或手工特征设计，就可被用于中文分词、词性标注以及命名实体识别等多种中文自然语言处理任务，甚至直接改造为分布式大数据可以使用的框架。

2.短文本

姑且认为200字以内的都叫短文本

2.1 短文本的研究范围

- 搜索引擎的搜索结果
- 锚文本
- 互联网聊天信息
- 电子邮件主题
- 论坛评论信息
- 商品描述信息
- 图片描述
- 微博
- 手机短息
- 文档文献摘要

了解本专栏

超级会员免费看

shiter

关注

13
点赞
踩
46

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录