- 博客(1)
- 收藏
- 关注
原创 task6 基于深度学习的文本分类
基于Bert的文本分类 Bert Pretrain预训练过程使用了Google基于Tensorflow发布的BERT源代码。首先从原始文本中创建训练数据,由于本次比赛的数据都是ID,这里重新建立了词表,并且建立了基于空格的分词器。class WhitespaceTokenizer(object): “”“WhitespaceTokenizer with vocab.”"" def init(self, vocab_file): self.vocab = load_vocab(voc
2020-08-04 23:47:32 117
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人