数据挖掘实验之用逻辑回归分析uci数据banknote_authentication,附python代码

本文介绍了使用逻辑回归进行数据分类,特别是在银行纸币验证(banknote_authentication)数据集上的应用。首先,解释了逻辑回归的基本原理,包括sigmoid函数和损失函数。接着,提供了uci数据集的下载链接,并给出了使用sigmoid函数的逻辑回归模型的代价函数、梯度下降法以及参数迭代的数学表达式。最后,展示了Python代码实现,强调由于随机选取测试数据,预测准确率大约在0.95左右,每次运行结果可能略有不同。
摘要由CSDN通过智能技术生成

逻辑回归:(用来做分类的,运用了线性回归的方法):

基础知识:
首先是用一个sigmoid函数,它是一个可以无限次数求导而且不归零的一个函数,正好在0和1中间0.5的位置有一个分界点,很好的表示了概率,概率大于0.5的取1,概率小于0.5的取0。
在这里插入图片描述

然后是我们平时用的二分类,比如我们用身高和鞋码做比喻,x轴是鞋码大小,y轴是身高,根据全班的身高和鞋码进行画图,得到下图,我们现在需要去判断一学生(已知身高鞋码)的男女,用下图中的直线进行分类,在线左边的分为女生,线右边的分为男生,这样的线可以有很多,怎么去找到哪根线是最合适的呢,这时候就引出了损失函数,离这根线的点的距离之和最小即可求出这根线的表达式。推广到高维。

请添加图片描述
具体操作:
uci data_banknote_authentication 数据集的下载
链接: http://archive.ics.uci.edu/ml/datasets/banknote+authentication
在这里插入图片描述
在这里插入图片描述
然后选择下载地址即可
在这里插入图片描述
如果通过网站下载不了的话(我们班有少数同学官网下载不了)
百度云盘链接:
https://pan.baidu.com/s/1uU9pgax2x6VfmEDr4ZlniQ
提取码:7d8c

用sigmoid函数来作为逻辑回归估计函数:
在这里插入图片描述

代价函数:在这里插入图片描述
用梯度下降法去逼近最低值,以及求出所需的参数。
偏导函数:
在这里插入图片描述
theta迭代函数:
![在这里插入图片描述](https://img-blog.csdnimg.cn/b632c22ab32a47f6b2801d63a0fed5c1.png
代码:

# -*- coding: utf-8 -*-
import math
import numpy
import random
import pandas as pd
data= pd.read_csv('C:/Users/95870/Desktop/banknote/data_banknote_authentication.txt',header=None)
X = data[[0,1,2,3]
  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值