基于深度学习的聊天机器人

基于深度学习的聊天机器人-项目前期知识准备


一、TensorFlow框架简介

TensorFlow 是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现。
1、谷歌基于DistBelief进行研发的第二代人工智能学习系统
2、用于语音识别或图像识别等多项机器学习和深度学习领域
3、将复杂的数据结构传输至人工智能神经网中进行分析和处理
4、支持CNN、RNN和LSTM算法,是目前在Image,Speech和NLP中最流行的深度神经网络模型。
使用流程见下图

二、NLP基础

以下链接均为各路大神所写,请移步学习。
如有侵权,联系删除!


1. 常用的神经网络模型

  1. 卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它包括卷积层(convolutional layer)和池化层(pooling layer)。
    大话卷积神经网络CNN

  2. 循环神经网络(Recurrent Neural Network, RNN)是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。
    大话循环神经网络RNN

  3. LSTM (Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
    LSTM原理及实现

  4. BP神经网络

2. 词法分析

  1. 分词技术
  2. 词性标注
  3. 命名实体识别
  4. 词义消歧

3.贝叶斯和朴素贝叶斯

贝叶斯和朴素贝叶斯

4. 隐马尔科夫模型

隐马尔科夫模型

5. 语料相关

语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。语料库中存放的是在语言的实际使用中真实出现过的语言材料。真实语料需要经过加工(分析和处理),才能成为有用的资源。

  1. 获取途径
    1.1 开放型语料数据集
    1.2 爬虫
    1.3 自有平台
  2. 语料处理
    2.1 获取语料
    2.2 格式化文本(去杂)
    2.3 特征工程

6. 语言模型

  1. Unigram models(一元文法统计模型)
  2. N-gram语言模型 (N元模型)

7. 词向量Word2vec

词向量1
词向量2

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值