决策树随机森林,对于异常值,可以通过降采样的方式
支撑向量为不为0的点
数据集都分对了,但哪一个是最优的呢?
找最近的距离,并取最大
核函数的意义
超平面
三个核函数中,高斯核函数是最合适的
支持向量网
看重视哪一个,调整参数
聚类
聚类
后验概率:
点是需要知道哪个分类的概率的
机器算法是经济学 ,假设检验是统计学
变量在机器算法中不一定要满足严格的假设检验,只需要在一定环境下,模型可用就行,更务实
主题模型