C语言程序设计课之朴素贝叶斯算法
第一次接触数据挖掘,觉得好有意思啊
测试了泰坦尼克号的数据,只取了年龄和性别这两个预测属性。
测试准确率78%
还是很棒棒的
算法核心:
朴素贝叶斯算法:
这个公式提供给了我们一个方法
当我们知道在B下A发生的概率时,可以预测A下发生B的概率。
就拿这个泰坦尼克号的训练集来说。
可以算出在死亡下发生年龄和性别的概率和在生存下发生年龄和性别的概率。
之后根据贝叶斯公式可以算出在在年龄和生存下发生死亡或者生存的概率
根据样本的情况算出其死亡和生存的值
其较大的就是预测结果
#include<stdio.h>
#include<stdlib.h>
#include<math.h>
#define K 10
#define DATASIZE 800
int people[1000][3];
void showme(int n)
{
int i,k;
for(i = 0; i < n; i++)
{
for(k = 0; k < 3; k&