[学习] 数据挖掘-贝叶斯分类(例子,代码)

什么是贝叶斯分类:

首先举个经典的例子, A病症检测: 有1/100的人A病症检测会成阳性,地球上有1/1000的人会的A病症,得了A病症的人有90%的概率显示A病症检测阳性,那么当一个人A病症检测阳性了他的得A病的概率是?
答案是 1/1000*0.9*100 = 0.09 9%的概率,怎么证明网上有很多,@link:http://www.cnblogs.com/leoo2sk/archive/2010/09/17/1829190.html
相关公式:
P(B|A) = P(A|B)P(B)/P(A)

一般操作:
使用大量数据作为训练集,来预测下新来数据的某一属性。
原理:
通过P(n)*P(a|n)*P(b|n),,,,计算已知参数在各个n的情况下的概率,取得最大的P就是预测结果

作为基础数据挖掘,就写个例子来玩下看,顺便Mark 下

例子:

生成一个爱好 收入表, 女生爱购物收入低,男生爱打球收入高
    public static void genTestBayes(String path) {
        for (int i = 0; i < 20000; i++) {
            String data = "";
            if (Math.random() <= 0.5) {
                data = data + "男 ";
                double son = Math.random();
                if (son > 0.95) {
                    data = data + "购物 ";
                } else if (son <= 0.6) {
                    data = data + "打球 ";
                } else if (son > 0.6 && son <= 0.85) {
                    data = data + "电影 ";
                } else {
                    data = data + "吃饭 ";
                }
                double daughter = Math.random();
                if (daughter > 0.5) {
                    data = data + "3000";
                } el
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值