逻辑回归:
一般来讲,其实是用于研究某个事件的概率,输出的结果往往是0或者1
而输入又往往不止一个。
就是用几个不同的因素去预测这个事件到底是发生,还是不发生。
在预测的过程中,用到的是神奇的sigmoid函数
还是来看一下购买商品与否的案例:一共有400行数据
第一列是买家的年龄,第二列是买家的薪水,第三列是结果(0代表买过,1代表未买)
我们将数据集分成两部分。300个数据用作训练集,其余的用作测试集。
用逻辑回归训练这100个训练集的买家到底是买还是不买!
- 数据处理
导入数据、设置自变量和因变量
dataset = pd.read_csv('S.csv')
X = dataset.iloc[:, [0,1]].values
y = dataset.iloc[:, 2].values
- 设置训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
- 用拟合器拟合数据