什么是贝叶斯分类:
首先举个经典的例子, A病症检测: 有1/100的人A病症检测会成阳性,地球上有1/1000的人会的A病症,得了A病症的人有90%的概率显示A病症检测阳性,那么当一个人A病症检测阳性了他的得A病的概率是?
答案是 1/1000*0.9*100 = 0.09 9%的概率,怎么证明网上有很多,@link:http://www.cnblogs.com/leoo2sk/archive/2010/09/17/1829190.html
相关公式:
P(B|A) = P(A|B)P(B)/P(A)
一般操作:
答案是 1/1000*0.9*100 = 0.09 9%的概率,怎么证明网上有很多,@link:http://www.cnblogs.com/leoo2sk/archive/2010/09/17/1829190.html
相关公式:
P(B|A) = P(A|B)P(B)/P(A)
一般操作:
使用大量数据作为训练集,来预测下新来数据的某一属性。
原理:
通过P(n)*P(a|n)*P(b|n),,,,计算已知参数在各个n的情况下的概率,取得最大的P就是预测结果
作为基础数据挖掘,就写个例子来玩下看,顺便Mark 下
例子:
生成一个爱好 收入表, 女生爱购物收入低,男生爱打球收入高
public static void genTestBayes(String path) {
for (int i = 0; i < 20000; i++) {
String data = "";
if (Math.random() <= 0.5) {
data = data + "男 ";
double son = Math.random();
if (son > 0.95) {
data = data + "购物 ";
} else if (son <= 0.6) {
data = data + "打球 ";
} else if (son > 0.6 && son <= 0.85) {
data = data + "电影 ";
} else {
data = data + "吃饭 ";
}
double daughter = Math.random();
if (daughter > 0.5) {
data = data + "3000";
} el