数据预处理
词嵌入
先将字符处理为向量,我选择使用已经训练好的词嵌入。
为什么可以使用别人训练好的词嵌入?
比如:篮球,在不同语境下都是一样的意思,我们新闻标题分类任务,算是比较大众的任务,所以我们可以使用别人做好的词嵌入;有一些词汇,可能在不同语境下含义不一样,需要更加专业的词嵌入。
文本分类的十个类别分别是
构建模型
TestRNN
设置路径
将npz格式的embedding,用numpy读进来,然后转tensor格式
参数设置
lstm模型
先将字符处理为向量,我选择使用已经训练好的词嵌入。
为什么可以使用别人训练好的词嵌入?
比如:篮球,在不同语境下都是一样的意思,我们新闻标题分类任务,算是比较大众的任务,所以我们可以使用别人做好的词嵌入;有一些词汇,可能在不同语境下含义不一样,需要更加专业的词嵌入。
文本分类的十个类别分别是
TestRNN
设置路径
将npz格式的embedding,用numpy读进来,然后转tensor格式
参数设置
lstm模型