机器学习
旭峰li
这个作者很懒,什么都没留下…
展开
-
机器学习几种方法总结——待完善
参考文献:中文文本分类的特征选择和权重计算以下内容链接 朴素贝叶斯方法: 基于条件独立性假设,即每一个特征对类别的影响是条件独立的,即特征之间相互不影响。其思路是:将文本看成一个特征集,计算特征对各个类别的先验概率(出现该特征时的文本属于每一类别的概率),根据该先验概率在测试集中计算出文本属于某个类别的后验概率,将文本分到概率最大的类中去。 k近邻方法: 给一个新的文本,计算出该文...原创 2018-05-08 15:57:04 · 371 阅读 · 0 评论 -
正常和缩减线性判别分析用于分类的区别(LDA 和 Shrinkage LDA)
通过图中对比两种算法的却别,噪声特征对样本数的比值越来越大时普通lda分类效果越来越低,而shrinkage lda 下降并不多。 代码中有效特征只有一个,其他都是噪音特征from __future__ import divisionimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets...原创 2018-06-02 18:37:29 · 1285 阅读 · 0 评论