机器学习二基于朴素贝叶斯模型实现对mnist数据集的分类

最新推荐文章于 2024-08-03 16:02:00 发布

江南无妖

最新推荐文章于 2024-08-03 16:02:00 发布

阅读量2.2k

点赞数 3

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caoyitong/article/details/123737967

版权

机器学习专栏收录该内容

8 篇文章 2 订阅

订阅专栏

原理分析

朴素贝叶斯算法

朴素贝叶斯方法是贝叶斯定理与特征条件独立假设相结合的分类方法。对于给定的训练数据，首先基于特征条件独立假设学习输入输出的联合概率分布；再利用贝叶斯定理算出后验概率最大的类。

朴素贝叶斯算法

拉普拉斯平滑

代码解析：

朴素贝叶斯

（1）加载数据

①加载数据，将mnist二进制数据集加载成矩阵形式

②将label值二值化，label>=5时为1，label<5时为0

③将data值二值化，当data=0时为0，当data!=0时为1

（2）计算概率

①计算先验概率

通过以下代码，可以得到P(Y=1),P(Y=-1)

prior_probability[label] += 1 #得到num(y=1) 和num(y=0)

prior_probability = np.array([prior_probability[i] / totalNum for i in range(2)])

# totalNum是图片总数（行数）生成先验概率数组[0.50990476 0.49009524]

②计算条件概率

通过以下代码，可以得到P(X=x|Y=1)和P(X=x|Y=0)

conditional_probability[label][j][temp] += 1

# 经过二值化的图像只有0，1两种取值
pix_0 = conditional_probability[i][j][0]
pix_1 = conditional_probability[i][j][1]
# 计算0，1像素点对应的条件概率

#这里采用了拉普拉斯平滑，在分子处+1，分母处+2
probability_0 = ((float(pix_0)+1) / (float(pix_0 + pix_1)+2))
probability_1 = ((float(pix_1)+1 )/ (float(pix_0 + pix_1)+2))

conditional_probability[i][j][0] = probability_0
conditional_probability[i][j][1] = probability_1

③计算后验概率

通过以下代码可以得到，P(Y=1|X=x) P(Y=0|X=x)

这里的label分别输入【0,1】，计算较大值

比较 P(Y=1|X=x) 和P(Y=0|X=x)，较大的P的Y值为该图片的label值

如果P(Y=1|X=x)较大，则label=1

否则为0；

④计算正确率

比较test中的每一个图片的label值，与通过train训练得到的label值，

如果错误，则错误数量errorCount++

除以总数得正确率

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
机器学习二基于朴素贝叶斯模型实现对mnist数据集的分类

原理分析朴素贝叶斯算法朴素贝叶斯方法是贝叶斯定理与特征条件独立假设相结合的分类方法。对于给定的训练数据，首先基于特征条件独立假设学习输入输出的联合概率分布；再利用贝叶斯定理算出后验概率最大的类。朴素贝叶斯算法拉普拉斯平滑代码解析：朴素贝叶斯（1）加载数据 ①加载数据，将mnist二进制数据集加载成矩阵形式 ②将label值二值化，label>=5时为1，label<5时为0 ③将data值二值化，当data=0...
复制链接

扫一扫

专栏目录

江南无妖 CSDN认证博客专家 CSDN认证企业博客

码龄4年

33: 原创

12万+: 周排名

7万+: 总排名

7万+: 访问

: 等级

459: 积分

3665: 粉丝

75: 获赞

10: 评论

477: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习四基于支持向量机SVM模型实现对mnist数据集的分类
m0_62996181: 求份源码谢谢
华为机试HJ16 购物单 C语言动态规划详细解答
江南无妖: (๑•̀ㅂ•́)و✧
PE文件解析--导入函数节.rdata
◇邹◇: 文中计算api个数那里一个减的直接就是dll的数量吧，毕竟对于每个dll都要有一个全0的结束符。还是谢谢作者的文章，写的很好。
密码学实现64bit RSA c语言
Paintrain: 64位rsa计算中途会产生大概96位数，这个unsigned long long int是怎么能处理的到的。。
华为机试HJ16 购物单 C语言动态规划详细解答
Tiger_pop: 这5种情况的分类讨论，感觉跳过了一些解释，我补充一下您看看对不对：首先是判断给定的钱数满足了主产品需求吗，到了就判断是否取了i，所以不取的情况还是 dp[i-1][j]；而之后的三个if 判断有点类似于冒泡，在上一个判断的基础上层层递进，目的是求五种情况中的最大值，所以每种情况不取时不在写 dp[i-1][j] 而是 dp[i][j]， dp[i][j] 指的是上一种情况Max 判断后的结果，层层递进选出五种情况的最大值。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。