我在python中从头开始实现了10倍的交叉验证。语言是Python3.6,我用Spyder(Anaconda)写的。我的输入形状是data=(1440390),label=(1440,1)。
我的代码:
def partitions(X,y):
np.random.shuffle(X)
foldx=[]
foldy=[]
j=0
for i in range(0,10):
foldx[i]=X[j:j+143,:]
foldy[i]=y[foldx[j]]
j+=144
return np.array(foldx),np.array(foldy)
def cv(X,y,model):
trainx,trainy=partitions(X,y)
scores=[]
for i in range(0,10):
xtest=trainx[i]
ytest=trainy[xtest]
xtrain=trainx[:i]+trainx[i+1:]
ytrain=trainy[xtrain]
model.fit(xtrain,ytrain)
preds=model.predict(xtest)
print(accuracy_score(np.ravel(ytest),preds))
scores.append(accuracy_score(np.ravel(ytest),preds))
return scores.mean()
错误出现在
foldx[i]=X[j:j+143,:]
上面写着
索引器错误:列表分配索引超出范围。
我该如何纠正?我没有从零开始解决这些问题的经验。