步骤记录
1.读取数据 用Jupter Notebook传入数据时老是报错,这个时候采用将csv文件以记事本格式打开,然后另存为,把下面的编码形式转换为utf-8。
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
data = pd.read_csv('data2.txt',encoding = 'utf-8')
print(data.head())
print(data.info())
print(data.head())打印数据集的前五行,由于本次数据集的列数很多,只截取一部分
print(data.info())打印数据集的信息,仍然只截取一部分
2.将标签数据标记为Y
X = data.drop('status',axis=1)
Y = data['status']
3.无关特征删除
删除对结果影响不大的特征
‘b