自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_43868510的博客

nlp

关注

关注数：文章数：1 文章阅读量：866 文章收藏量：1

作者: 我都不知道在搞什么

这个作者很懒，什么都没留下…

展开

多轮对话是否需要改写(文本分类embedded初探)

环境： python3.7 tnsorflow1.14 repo目录结构：数据集介绍：使用的数据集为自己构建的QA数据集，由于数据量较少，不区分验证集与测试集。注：原始数据以txt文本格式保存，标签分为pos与neg，因此预处理主要是将标签与数据分开对应保存，并将数据分为训练集与测试集。数据预处理： import os from collections import Counter def slide_word(text: str, l): result = [] if len

原创 2021-12-29 11:33:20 · 866 阅读 · 0 评论