在做情感分类模型是,最初的数据预处理报错AttributeError: 'list' object has no attribute 'decode',源码如下:
import torch.nn as nn
import jieba
data_path = "data.csv"
data_list = open(data_path).readlines()[1:]
for item in data_list:
label = item[0]
content = item[2:].split()
seg_list = jieba.cut(content,cut_all=False)
for seg_item in seg_list:
print(seg_item)
这里报错的原因是由于readlines()读取的数据是list类型,导致后面content的数据类型也为list;但在做jieba分词的时候,需要使用str类型,使用需要将content强制类型转换为str:
import torch.nn as nn
import jieba
data_path = "data.csv"
data_list = open(data_path).readlines()[1:]
for item in data_list:
label = item[0]
content = str(item[2:].split())
seg_list = jieba.cut(content,cut_all=False)
for seg_item in seg_list:
print(seg_item)
程序报错如下:

在构建情感分类模型时,遇到数据预处理阶段的错误,问题出在尝试对list对象调用decode方法。代码中,从data.csv文件读取的data_list是list类型,内容应转换为str才能进行jieba分词。修复方法是将content变量转换为str类型,即`content=str(item[2:].split())`,之后分词过程顺利进行。
3464

被折叠的 条评论
为什么被折叠?



