with open(path, 'r', encoding='UTF-8') as f:
for line in tqdm(f):
lin = line.strip()
if not lin:
continue
if len(lin.split('\t')) == 2:
content, label = lin.split('\t')
对于这个项目
Chinese-Text-Classification-Pytorch
中文文本分类,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer, 基于pytorch,开箱即用。
用了自己的数据集一直报错:
content, label = lin.split('\t')
ValueError: not enough values to unpack (expected 2, got 1)
经过不断的调试输入
if len(lin.split('\t')) == 2: content, label = lin.split('\t')
终于跑通了。
这个我觉得还要注意的点就是
防止新手踩坑,