《机器学习》西瓜书课后题7.3

最新推荐文章于 2023-05-07 22:01:38 发布

Aissen_F

最新推荐文章于 2023-05-07 22:01:38 发布

阅读量1.8k

点赞数 3

分类专栏： learning

本文链接：https://blog.csdn.net/weixin_42152526/article/details/91635459

版权

本文详细探讨了《机器学习》一书中7.3题关于拉普拉斯修正的朴素贝叶斯方法。文章指出在计算连续属性的条件概率时，需要注意pandas与numpy中方差的区别，并提供了python代码实现，展示了正例和负例的类先验概率及类条件概率，最终计算出判断为正例和负例的概率。

摘要由CSDN通过智能技术生成

《机器学习》课后题7.3

拉普拉斯修正后的朴素贝叶斯
要特地提醒一下，pandas的方差是无偏样本方差，numpy的方差是样本方差
书上152页用的显然是pandas中的，不然算出来连续属性的条件概率会有误差
关于这里的方差具体用哪一种暂时还没有看到特别的说法，只要始终用同一种应该不会影响最后的判断结果

python代码

import numpy as np
import pandas as pd


Data = np.array([
    [1, 1, 1, 1, 1, 1, 0.697, 0.460, 1],
    [2, 1, 2, 1, 1, 1, 0.774, 0.376, 1],
    [2, 1, 1, 1, 1, 1, 0.634, 0.264, 1],
    [1, 1, 2, 1, 1, 1, 0.608, 0.318, 1],
    [3, 1, 1, 1, 1, 1, 0.556, 0.215, 1],
    [1, 2, 1, 1, 2, 2, 0.403, 0.237, 1],
    [2, 2, 1, 2, 2, 2, 0.481, 0.149, 1],
    [2, 2, 1, 1, 2, 1, 0.437, 0.211, 1],
    [2, 2, 2, 2, 2, 1