根据公式:
可以得出:
这里进行计算时,只需要计算分子,比较大小,因为分母只是对数值有影响,对两个数的比较不会产生影响
import numpy as np
"""创建数据集"""
def loadDataSet():
postingList = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],
['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], # stupid侮辱类
['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],
['