基于深度学习的自然语言处理——介绍

本文介绍了自然语言处理的挑战,如语言的非形式化、歧义和稀疏性,并探讨了神经网络和深度学习如何应用于解决这些问题。重点讲述了嵌入层的作用以及前馈网络和循环神经网络在处理语言序列数据中的应用。
摘要由CSDN通过智能技术生成

介绍

自然语言处理的挑战

  • 语言不能被形式化地描述和理解;
  • 使用不明确规则集处理歧义和多样输入;
  • 自然语言存在的特性:离散性、组合性、稀疏性,使得自然语言处理更困难;
  • 语言存在组合性;

以上性质的组合导致了数据稀疏性。(单词组合是无限的、合法句子是无限的)

神经网络与深度学习

  • 神经网络是机器学习的一个分支,是神经网络的重命名
  • 不仅学习预测,而且要学习正确地表示数据,使其更有助于预测;

自然语言中的深度学习

  • 将神经网络用于语言的主要组件是嵌入层将离散的符号映射为相对较低维度的连续向量
  • 主要使用的两个神经网络结构
    • 前馈网络(MLP)
      • 特点
        • 输入大小固定
        • 对于变化的输入长度,可以忽略元素的顺序
        • 线性模型所能应用的地方都可以使用前馈网络
      • 卷积前馈网络
        • 特点
          • 善于抽取数据中有意义的局部模式,这些模式对词序敏感,但忽略出现的位置;
          • 适合识别长句子或文本
    • 循环神经网络
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值