kaggle常见操作及错误
常用操作
读取文件时,查看当前文件夹:
from subprocess import check_output
print(check_output(["ls", "../input"]).decode("utf8"))
上传到kaggle的文件直接位于input
文件夹下(不用管input显示的下层文件夹)
注意,魔术行和命令直接不要有空格 % ls
错误。
kaggle一开始,默认处于kaggle/working
因而直接使用xArr, yArr = loadDataSet('../input/ex0.txt')
读取文件即可。
使用sklearn机器学习库
绘制混淆矩阵
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import numpy as np
def cm_plot(original_label, predict_label, pic=None):
cm = confusion_matrix(original_label, predict_label) # 直接生成n*n混淆矩阵
plt.figure()
plt.matshow(cm, cmap=plt.cm.YlOrRd) # 画混淆矩阵,配色风格使用cm.Blues
plt.colorbar() # 添加颜色渐变标签
for x in range(len(cm)):
for y in range(len(cm)):
plt.annotate(cm[x, y], xy=(x, y)