1. 前情:
当我从.h5文件中读取text的时候,发现里面的字符串表现形式都是这样的:
b"so, i have been to ```"
前面都有个b???然后更懵的是看着都是一个个str组成的呀,但是当我是用data[i]想要读取其中一个单词的时候,返回的是int类型的数据。
2. 原因:
1)前面的b提示当前数据是bytes类型而非str类型,在python3中对两者是进行了区分的。
2)一般在保存文件的时候会将数据转成bytes类型,但是现在我没有转回str类型。
3. 解决方法:data = str(data, encoding = 'utf-8')
具体更加详细的解释可以看下面的博文:Python3中的bytes和str类型_lyb3b3b的专栏-CSDN博客