基于概率论的分类方法:朴素贝叶斯
经典举例:已知学校总人数N,男生占3/5,都穿长裤,女生占2/5,一半穿长裤,一般穿裙子。
(1).穿长裤的人数:N*3/5 + N*2/5*1/2
(2).当你看到一个人穿长裤,不知性别时,问该人是女生的概率?
P(女生|长裤) = 女生穿长裤的人数/穿长裤总人数 = P(女)*P(长裤|女)/P(长裤)
经典贝叶斯公式:
下面通过对文本进行分类来理解贝叶斯模型:
1、准备数据
其中列表中的每一项来自斑点犬爱好者留言板,这些留言文本被切分成一系列的词条集合,标点符号从文本中去掉,留言的文本被分为两类,分为侮辱性和非侮辱性。
def loadDataSet():
dataSet = [['my','dog','has','