在利用结巴(jieba)进行分词时出现如下错误,AttributeError: 'float' object has no attribute 'decode': 真实挺无语的,当读取编码为utf8时不会报错,当读取为gbk时会报这类错误,这个可以解决很多此类型的错误。
原始内容:
def cutword(x):
seg = jieba.cut(x) #结巴分词函数
return ' '.join(seg)#
df['seg_word']=df['title'].apply(cutword)
解决办法: