数据的预处理阶段
#数据的预处理阶段
#分别读标签为0和1的数据
train_0=pd.read_csv("C:/Users/86151/data_label_0.csv",header=None) #读数据时默认第一行为colunms,但是这个数据中没有,所以要header=None
train_1=pd.read_csv("C:/Users/86151/data_label_1.csv",header=None)
test=pd.read_csv("C:/Users/86151/data_test.csv",header=None)
train_1=train_1.iloc[:566,:64]
#将标签为0和1的数据进行合并
#numpy.vstack函数:垂直按顺序堆叠数组
x_future=np.vstack((train_0,train_1))
a=[0]*train_0.shape[0]
b=[1]*train_1.shape[0]
y=a+b #此时的y是数组类型:[0,0,...,1,1]
y=pd.DataFrame(y)
构建训练模型
x_train,x_test,y_train,y_test=train_test_split(x_future,y,test_size=0.2,random_state=33)
Logistics 回归模型进行预测
lr = LogisticRegression(solver='liblinear')
# 调用LogisticRegression中的fit函数/模块用来训练模型参数。
lr.fit(x_train, y_train.astype('int'))
# 使用训练好的模型lr对X_test进行预测。
lr_y_predict