【机器学习】吴恩达作业2.1，python实现线性不可分logistic逻辑回归

—Xi—

已于 2022-10-25 21:07:30 修改

阅读量3.3k

点赞数 5

分类专栏：机器学习

于 2022-04-01 10:51:00 首次发布

本文链接：https://blog.csdn.net/m0_51933492/article/details/123890566

版权

机器学习分类回归

机器学习专栏收录该内容

19 篇文章 40 订阅

订阅专栏

2.1.Logistic回归模型 (线性不可分)

用正则化的Logistic回归模型来预测一个制造工厂的微芯片是否通过质量保证（QA），在QA过程中，每个芯片都会经过各种测试来保证它可以正常运行。假设你是这个工厂的产品经理，你拥有一些芯片在两个不同测试下的测试结果，从这两个测试，你希望确定这些芯片是被接受还是拒绝，为了帮助你做这个决定，你有一些以前芯片的测试结果数据集，从中你可以建一个Logistic回归模型。

正则化：

如果有过多特征，则假设函数会很好的拟合训练集，代价函数可能近于0，但是泛化性很差，预测新样本的能力较弱

解决

1 减少特征数：人工筛选保留特征或模型选择算法

2 正则化 : 保留所有特征，但是减少量级或theta的大小。多个特征，每一个都对我们的预测有帮助

https://blog.csdn.net/weixin_44750583/article/details/88377537

带正则项的损失函数

带正则项的梯度下降

python实现

1 读取数据并可视化

#1.读取
path = 'ex2data2.txt'
data = pd.read_csv(path, names=['Exam1', 'Exam2', 'Accepted'])
data.head()

#2.数据可视化
fig, ax = plt.subplots()
ax.scatter(data[data['Accepted'] == 0]['Exam1'], data[data['Accepted'] == 0]['Exam2'], c='r', marker='x', label='y=0')
ax.scatter(data[data['Accepted'] == 1]['Exam1'], data[data['Accepted'] == 1]['Exam2'], c='b', marker='o', label='y=1')
ax.legend()
ax.set_xlabel('exam1')
ax.set_ylabel('exam2')
plt.show()
# 从特征图看出来，这是线性不可分，下一步是特征映射

2.特征映射，创建高阶项特征

#3.特征映射
def feature_mapping(x1, x2, power):
    data = {}
    for i in np.arange(power + 1):
        for j in np.arange(i + 1):
            data['F{}{}'.format(i - j, j)] = np.power(x1, i - j) * np.power(x2, j)
    return pd.DataFrame(data)

x1 = data['Exam1']
x2 = data['Exam2']
data2 = feature_mapping(x1, x2, 6)
print(data2.head())

#4.构建数据集
X = data2.values
# (118, 28)
print(X.shape)
y = data.iloc[:, -1].values
y = y.reshape(len(y), 1)
# (118, 1)
print(y.shape)

3.带正则项的损失函数不惩罚第一项theta[0]


# 损失函数
# 多项式需要正则化
# λ越小，容易过拟合；λ越大，容易欠拟合

def sigmoid(z):
    return 1 / (1 + np.exp(-z))


def Cost_Function(X, y, theta, lr):
    A = sigmoid(X @ theta)
    first = y * np.log(A)
    second = (1 - y) * np.log(1 - A)
    reg = np.sum(np.power(theta[1:], 2)) * (lr / (2 * len(X)))
    return -np.sum(first + second) / len(X) + reg

theta = np.zeros((28, 1))
print(theta.shape)
lr = 1
cost_init = Cost_Function(X, y, theta, lr)
print(cost_init)

4.带正则项的梯度下降，不惩罚第一项theta[0]

def gradientDescent(X, y, theta, alpha, iters, lr):
    costs = []
    for i in range(iters):
        reg = theta[1:] * (lr / len(X))
        reg = np.insert(reg, 0, values=0, axis=0)
        A = sigmoid(X @ theta)
        # X.T:X的转置
        theta = theta - (X.T @ (sigmoid(X @ theta) - y)) * alpha / len(X) - reg * alpha
        cost = Cost_Function(X, y, theta, lr)
        costs.append(cost)
        # if i % 1000 == 0:
        #     print(cost)
    return theta, costs


alpha = 0.001
iters = 200000
lamda = 0.01

theta_final, costs = gradientDescent(X, y, theta, alpha, iters, lamda)
print(costs)
print(theta_final)

注意：不对第一项做正则化

5.预测及准确率

# 准确率
def predict(X, theta):
    prob = sigmoid(X @ theta)
    return [1 if x >= 0.5 else 0 for x in prob]


y_ = np.array(predict(X, theta_final))
print(y_)
y_pre = y_.reshape(len(y_), 1)
# 求取均值
acc = np.mean(y_pre == y)
print(acc)

6 决策界面

# 决策界面
x = np.linspace(-1.2, 1.2, 200)
xx, yy = np.meshgrid(x, x)
z = feature_mapping(xx.ravel(), yy.ravel(), 6).values
zz = z @ theta_final
zz = zz.reshape(xx.shape)
fig, ax = plt.subplots()
ax.scatter(data[data['Accepted'] == 0]['Exam1'], data[data['Accepted'] == 0]['Exam2'], c='r', marker='x', label='y=0')
ax.scatter(data[data['Accepted'] == 1]['Exam1'], data[data['Accepted'] == 1]['Exam2'], c='b', marker='o', label='y=1')
ax.legend()
ax.set_xlabel('exam1')
ax.set_ylabel('exam2')
plt.contour(xx, yy, zz, 0)
plt.show()