nlu
文章平均质量分 66
我都不知道在搞什么
这个作者很懒,什么都没留下…
展开
-
多轮对话是否需要改写(文本分类embedded初探)
环境: python3.7 tnsorflow1.14 repo目录结构: 数据集介绍: 使用的数据集为自己构建的QA数据集,由于数据量较少,不区分验证集与测试集。 注:原始数据以txt文本格式保存,标签分为pos与neg,因此预处理主要是将标签与数据分开对应保存,并将数据分为训练集与测试集。 数据预处理: import os from collections import Counter def slide_word(text: str, l): result = [] if len原创 2021-12-29 11:33:20 · 901 阅读 · 0 评论 -
Seq2Seq模型学习笔记
Seq2Seq前言实战代码数据集数据概览数据预处理模型构建EncoderDecodertarget数据处理构造Decoder模型预测总结 前言 我们来看一个简单的Seq2Seq实现,我们将使用TensorFlow来实现一个基础版本的Seq2Seq,主要帮助理解Seq2Seq中的基础架构。 最基础的Seq2Seq模型包含了三个部分,即Encoder、Decoder以及连接两者的中间状态向量,Encoder通过学习输入,将其编码成一个固定大小的状态向量S,继而将S传给Decoder,Decoder再通过对状态向原创 2021-05-08 14:06:15 · 299 阅读 · 0 评论