在用numpy的loadtxt导入数据文件时候,发现有报错:
经过如下:
第一次:
#数据准备
raw_data = np.loadtxt('D:/jupter_workspace/chapter4/cluster.txt') #导入数据文件
X = raw_data[:, :-1] # 分割要聚类的数据
y_true = raw_data[:, -1]
print(X)
-----------------------------
打印输出结果报错:
raw_data = np.loadtxt('D:/jupter_workspace/chapter4/cluster.txt') #导入数据文件
File "E:\Anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1093, in loadtxt
first_line = next(fh)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x83 in position 88: illegal multibyte sequence
第二次:
上边报错是UnicodeDecodeError吧啦吧啦的一些错误,那我就加上encoding='utf-8’试一试
#数据准备
raw_data = np.loadtxt('D:/jupter_workspace/chapter4/cluster.txt',encoding='utf-8') #导入数据文件
X = raw_data[:, :-1] # 分割要聚类的数据
y_true = raw_data[:, -1]
print(X)
-------------------------------------------------
打印输出结果还是报错:
ile "E:/tsf/655295/clusterAnalysisCode.py", line 14, in <module>
raw_data = np.loadtxt('D:/jupter_workspace/chapter4/cluster.txt',encoding='utf-8') #导入数据文件
File "E:\Anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1141, in loadtxt
for x in read_data(_loadtxt_chunksize):
File "E:\Anaconda3\lib\site-packages\numpy\lib\npyio.py", line 1068, in read_data
items = [conv(val) for (conv, val) in zip(converters, vals)]

在使用numpy的loadtxt函数导入数据文件时,遇到UnicodeDecodeError和ValueError。通过设置encoding='utf-8'解决编码问题,然后利用skiprows=1参数跳过包含列名的第一行,最后指定dtype='str'成功导入数据。
最低0.47元/天 解锁文章
3763

被折叠的 条评论
为什么被折叠?



