注:案例使用语言为scala;并基于Spark Mllib
2.朴素贝叶斯实例
在进行朴素贝叶斯实验之前,需要预处理数据格式如下:
label,factor1 factor2 .... factorn
如:
0,1 0 0
0,2 0 0
1,0 1 0
.......
其中,第一列为类别标签,后面以空格隔开的为特征(因子)
2.1 实例一
//导入包
import org.apache.spark.mllib.util.MLUtiles
import org.apache.spark.mllib.{SparkConf,SparkContext}
import org.apache.spark.mllib.classification.{NaiveBayes,NaiveBayesModel}
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
object BayesTest{
def main(args:Aarray[String]){
val conf = new SparkConf()
.setAppName("BayesTest")