今天在拿到 科大讯飞 移动广告反欺诈算法挑战赛 数据的之后,刚开始用pd.read_csd()读取文件就给我报错,显示这个错误。
# 导入数据
data_path = './移动广告反欺诈算法挑战赛/'
test_df = pd.read_csv(data_path + 'round1_iflyad_anticheat_testdata_feature.txt', delimiter="\t")
train_df = pd.read_csv(data_path + 'round1_iflyad_anticheat_traindata.txt', delimiter="\t")
没开个好头啊!
当然,解决的方法也是很简单的,把中文路径改成英文就可以了。
但是想了一下,在我的代码首行不是敲了 # -*- coding: utf-8 -*- 了吗?按理来说应该支持中文了啊,怎么会报错呢?
后面查看了pandas源码才知道,原来panda默认使用的是C解析。
当然,如果不想把中文名字改了,当然也是可以的。代码改成
pd.read_csv(open(data_path + 'round1_iflyad_anticheat_traindata.txt'), delimiter="\t")