基于深度学习的聊天机器人-项目前期知识准备
文章目录
一、TensorFlow框架简介
TensorFlow 是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现。
1、谷歌基于DistBelief进行研发的第二代人工智能学习系统
2、用于语音识别或图像识别等多项机器学习和深度学习领域
3、将复杂的数据结构传输至人工智能神经网中进行分析和处理
4、支持CNN、RNN和LSTM算法,是目前在Image,Speech和NLP中最流行的深度神经网络模型。
使用流程见下图
二、NLP基础
以下链接均为各路大神所写,请移步学习。
如有侵权,联系删除!
1. 常用的神经网络模型
-
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它包括卷积层(convolutional layer)和池化层(pooling layer)。
大话卷积神经网络CNN -
循环神经网络(Recurrent Neural Network, RNN)是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。
大话循环神经网络RNN -
LSTM (Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
LSTM原理及实现
2. 词法分析
3.贝叶斯和朴素贝叶斯
4. 隐马尔科夫模型
5. 语料相关
语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。语料库中存放的是在语言的实际使用中真实出现过的语言材料。真实语料需要经过加工(分析和处理),才能成为有用的资源。
- 获取途径
1.1 开放型语料数据集
1.2 爬虫
1.3 自有平台 - 语料处理
2.1 获取语料
2.2 格式化文本(去杂)
2.3 特征工程
6. 语言模型
- Unigram models(一元文法统计模型)
- …
- N-gram语言模型 (N元模型)