1. ValueError: Unknown label type: 'unknown‘
使用pandas读入数据后,数据默认的属性为“object”,在做机器学习时就会报错。
列如,做随机森林时:
acmg = pd.read_csv(inputfile, sep = '\t')
Y = acmg_balance["diagnosis"]
clf = RandomForestClassifier(n_estimators=10, max_depth=None,min_samples_split=2, random_state=0)
clf.fit(X,Y)
ValueError: Unknown label type: 'unknown‘
查看Y的格式:
Y.shape
如何修改:
Y = Y.astype('int')
(持续更新自己遇到的点点滴滴。。。)