逻辑回归简单介绍
1.1逻辑回归英文名称
逻辑回归(logistic regression),因此调包时常用lr代替逻辑回归算法包。
1.2逻辑回归优劣势
优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;
缺点:容易欠拟合,分类精度可能不高
1.3逻辑回归的应用
1、逻辑回归模型现在同样是很多分类算法的基础组件,比如 分类任务中基于GBDT算法+LR逻辑回归实现的信用卡交易反欺诈,CTR(点击通过率)预估等,其好处在于输出值自然地落在0到1之间,并且有概率意义。模型清晰,有对应的概率学理论基础。它拟合出来的参数就代表了每一个特征(feature)对结果的影响。也是一个理解数据的好工具。但同时由于其本质上是一个线性的分类器,所以不能应对较为复杂的数据情况。
2、经常用lr来做一些任务的baseline(基线)
2 逻辑回归应用
2.1逻辑回归算法库
from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
1
2
逻辑回归是sklearn库里的一部分
用lr赋值来表示逻辑回归的函数
2.2逻辑回归的简单应用
2.2.1 构建一个简单的数据集
x_train = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y_train = np.array([0, 0, 0, 1, 1, 1])
1
2
2.2.2 用逻辑回归模型拟合上面构建的数据集
lr = lr.fit(x_train,y_train)
1
2.2.3 查看模型拟合数据后的参数
print('逻辑回归模型的权重:',lr.coef_)
print('逻辑回归模型的截距:',lr.intercept_)