记录机器学习 Task01
任务名称
基于逻辑回归的分类预测
过程中遇到的问题及解决方法:
错误1
用逻辑回归模型拟合构造的数据集
lr_clf = lr_clf.fit(x_fearures, y_label) #其拟合方程为y = w0+w1x1+w2x2
执行时出现错误:Found input variables with inconsistent numbers of samples: [6, 5]
解决1
经过查询为x与y形状不一致导致的问题,返回去看x和y的形状发现y少输入了一个值。更改后问题消除。
收获
获取系数的方法:lr_clf.coef_
疑问
疑问1
x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]])
y_label = np.array([0, 0, 0, 1, 1, 1])
lr_clf = LogisticRegression()lr_clf = lr_clf.fit(x_fearures, y_label)
为什么其拟合方程为y = w0+w1x1+w2x2?而不是y = w0x + w1x1
解答:因为x中有两个特征值,通过给两特征值赋予不同的权重来预测目标值。
疑问2
x_fearures中fearures是什么意思?并没有查到这个英文单词的意义?
收获
逻辑回归目标:实现二分类
方程式:y=w0+w(i)(T转置)*x(i)
假设函数:sigmoid
决策边界:sigmoid自变量≥0时,即sigmoid函数值≥0.5时,取值1
sigmoid自变量<0时,即sigmoid函数值<0.5时,取值0
损失函数: