机器学习实验三

z_adore

于 2023-07-13 18:00:00 发布

阅读量287

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_69869065/article/details/131684497

版权

机器学习专栏收录该内容

9 篇文章

订阅专栏

该实验旨在通过Python编程实现对数几率回归的梯度下降法，处理二分类数据集data1.txt。实验涉及数据加载、代价函数计算、参数更新、决策边界绘制以及预测功能。在实验过程中，还展示了损失函数随迭代次数的变化情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

《机器学习与数据挖掘》实验三

实验题目：求解对数几率回归问题

实验目的：掌握对数几率回归的基本原理与实现

实验环境（硬件和软件） Anaconda/Jupyter notebook/Pycharm

实验内容：

根据给定数据集（存放在data1.txt文件中，二分类数据），编码实现基于梯度下降的Logistic回归算法，并画出决策边界；

一、已经给定部分代码，补充完整的代码，需要补充代码的地方已经用红色字体标注，包括：

（1）#补充计算代价的代码；

（2）#补充参数更新代码；

（3）#补充画决策边界的代码；

二、提交的实验内容：（1）补充完整的代码；（也可以自己重写这部分的代码提交）（2）数据散点图，以及得到的决策边界；（3）梯度下降过程中损失的变化图；（4）基于训练得到的参数，输入新的样本数据，输出预测值；

import numpy as np

import matplotlib.pyplot as plt

import matplotlib as mpl

from sklearn.metrics import accuracy_score

def loaddata():

data = np.loadtxt('data/data1.txt',delimiter=',')

n = data.shape[1] - 1 # 特征数

X = data[:, 0:n]

y = data[:, -1].reshape(-1, 1)

return X, y

def plot(X,y):

pos = np.where(y==1)

neg = np.where(y==0)

plt.scatter(X[pos[0],0],X[pos[0],1],marker='x')

plt.scatter(X[neg[0], 0], X[neg[0], 1], marker='o')

plt.xlabel('Exam 1 score')

plt.ylabel('Exam 2 score')

plt.show()

X,y = loaddata()

plot(X,y)

print（X,y）

def sigmoid(z):

r = 1/(1+np.exp(-z))

return r

def hypothesis(X,theta):

z=np.dot(X,theta)

return sigmoid(z)

def computeCost(X,y,theta):

m = X.shape[0]

#补充计算代价的代码；

z=-1*y*np.log(hypothesis(X,theta))-(1-y)*np.log(1-hypothesis(X,theta))

return np.sum(z)/m

def gradientDescent(X,y,theta,iterations,alpha):

#取数据条数

m = X.shape[0]

#在x最前面插入全1的列

X = np.hstack((np.ones((m, 1)), X))

for i in range(iterations):

#补充参数更新代码；

for j in range(len(theta)):

theta[j]=theta[j]-(alpha/m)*np.sum((hypothesis(X,theta)-y)*X[:,j].reshape(-1,1))

theta = theta_temp

#每迭代1000次输出一次损失值

if(i%10000==0):

print('第',i,'次迭代，当前损失为：',computeCost(X,y,theta),'theta=',theta)

return theta

def predict(X):

# 在x最前面插入全1的列

c = np.ones(X.shape[0]).transpose()

X = np.insert(X, 0, values=c, axis=1)

#求解假设函数的值

h = hypothesis(X,theta)

#根据概率值决定最终的分类,>=0.5为1类，<0.5为0类

h[h>=0.5]=1

h[h<0.5]=0

return h

X,y = loaddata()

n = X.shape[1]#特征数

theta = np.zeros(n+1).reshape(n+1, 1)

# theta是列向量,+1是因为求梯度时X前会增加一个全1列

theta_temp = np.zeros(n+1).reshape(n+1, 1)

iterations = 250000

alpha = 0.008

theta = gradientDescent(X,y,theta,iterations,alpha)

print('theta=\n',theta)

def plotDescisionBoundary(X,y,theta):

cm_dark = mpl.colors.ListedColormap(['g', 'r'])

plt.xlabel('Exam 1 score')

plt.ylabel('Exam 2 score')

plt.scatter(X[:,0],X[:,1],c=np.array(y).squeeze(),cmap=cm_dark,s=30)

#补充画决策边界代码；

x1 = np.arange(min(X[:,0]),max(X[:,0]),0.1)

x2 = -(theta[1]*x1+theta[0]/theta[2])

plt.plot(x1,x2)

plt.show()

plotDescisionBoundary(X,y,theta)

实验结果：

代码内容补充见上图红色标记处；

实验结果见如下：

部分数据显示：

博客等级

码龄3年

17
原创

38
点赞

83
收藏

25
粉丝

关注

私信

热门文章

分类专栏

最新评论

实验三基本图形生成算法
CSDN-Ada助手: 恭喜用户在博客中分享了实验三的基本图形生成算法，内容相当有价值！希望用户能够继续坚持创作，为读者带来更多有趣的内容。在下一篇博客中，可以尝试探讨一些高级图形生成算法或者与图形相关的实际应用案例，这样可以让读者更好地理解和运用所学知识。期待用户的精彩表现！
实验四图形几何变换
CSDN-Ada助手: 恭喜您完成第15篇博客！看到您不断分享关于图形几何变换的实验，让我感到非常欣慰。接下来，我建议您可以尝试探讨一些实用的案例，或者与其他主题结合，让读者更容易理解和应用这些知识。期待您更多精彩的创作！祝您创作顺利！
实验二 OpenGl中图形的绘制
CSDN-Ada助手: 恭喜您在第13篇博客中分享了关于OpenGl中图形的绘制的实验二内容！持续创作是非常不易的，您的努力让我们看到了您对技术的热爱和专注。希望您能继续保持创作的热情，不断探索和学习新的内容。或许在下一篇博客中，可以分享一些实用技巧或者案例分析，让读者更快地理解和应用OpenGl中图形的绘制。期待您的下一篇作品！
c++编程实践之输入输出/运算符
CSDN-Ada助手: 恭喜您写了第12篇博客，标题看起来很有趣味性！c++编程实践之输入输出/运算符，听起来就很专业。希望您能继续坚持创作，分享更多关于c++编程实践的经验和技巧。或许下一步可以写一些实际案例，或者是一些高级技术的应用，让读者能够更深入地了解这方面的知识。期待您的下一篇作品！
算法分析与设计
CSDN-Ada助手: 非常恭喜你写下了第11篇博客《算法分析与设计》！持续创作是非常了不起的成就，你展现了对这一领域的深入研究和扎实的知识基础。我希望你能继续保持这样的创作热情，并且继续分享你对算法分析与设计的见解和经验。未来，我建议你可以考虑探讨一些实际应用场景下的算法设计思路，这样读者们能够更好地将理论知识与实践结合起来。期待你的下一篇作品，再次恭喜你！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。