浅析NLP中的CNN卷积神经网络

浅析NLP中的CNN卷积神经网络

CNN卷积神经网络多见于图像识别或图像处理任务。但是在NLP(自然语言处理)任务中也有它的用武之地。在这里对卷积神经网络进行简单的介绍,并对一维卷积神经网络在NLP任务中的使用进行简单的介绍,希望对接触或使用CNN的小伙伴们有帮助,也欢迎大家就原理及内容进行评论探讨。

一、中文自然语言处理之词共现概率简介

中文文本有其特有的语法特点,每个字本身都具有一定的含义。连字成词,连词成文。这就意味着,词共现概率可以在中文文本的NLP任务重发挥重要作用。
什么是词共现概率呢?简单说,形式上就是一种条件概率。条件就是“单词A出现”,然后概率值的的含义就是当“单词A出现”时,相邻的单词B出现的概率,以此类推。
在训练模型时需要设定好窗口范围,比如当前词前两个词加后两个词,共五个词,的共现概率可以组成一个数组。通过这种方式,可以将分好词的文本向量化。

二、什么是卷积神经网络

卷积,其实是自然界中最常见的现象。一句话,就是移位乘加运算。
核心在于,根据任务的不同,怎样设计卷积的维度与窗口,并设定好移位卷积运算的步长。

三、一维卷积神经网络在NLP任务中的应用

中文文本是序列化的语言,在进行数字化、向量化时,特别适合做成一维数据序列。这样设计的神经网络模型运算效率会比较高。
卷积神经网络处理中文文本的优势在于特征提取速度快,缺点是卷积窗口覆盖范围内的文本原词之间的相互联系体现不出来。可以通过配合词共现概率的数字化方式得以弥补和改善。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

crossuniverse

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值