机器学习
sheep8521
让优秀成为一种习惯
展开
-
机器学习的应用(二)机器学习之特征选择
特征选择方法初识: 1、为什么要做特征选择在有限的样本数目下,用大量的特征来设计分类器计算开销太大而且分类性能差。2、特征选择的确切含义将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。3、特征选取的原则获取尽可能小的特征子集,不显著降低分类精度、不影响类分布以及特征子集应具有稳定适应性强等特点 主要有三种方法: 1、Filter方法 其主要思想是:对每一维的特征“打分”,即给每一维的特征赋予权...转载 2020-08-18 16:18:41 · 1404 阅读 · 0 评论 -
机器学习的应用(一)使用场景之判别式模型和生成式模型
一、机器学习之判别式模型和生成式模型 判别式模型(Discriminative Model)是直接对条件概率p(y|x;θ)建模。常见的判别式模型有线性回归模型、线性判别分析、支持向量机SVM、神经网络、boosting、条件随机场等。 举例:要确定一个羊是山羊还是绵羊,用判别模型的方法是从历史数据中学习到模型,然后通过提取这只羊的特征来预测出这只羊是山羊的概率,是绵羊的概率。 生成式模型(Generative Model)则会对x和y的联合分布p(x,y)建模,然后通过贝叶斯公式来求得p(yi|x),然后原创 2020-08-18 16:03:50 · 763 阅读 · 0 评论 -
机器学习之常用术语
1.离散和连续属性的判断方法? 离散值是确定的一些值,连续值是无序,有范围的。比如硬币只有 0和1 两种情况,就叫离散值,而人的身高有无数种情况,就叫连续值。 ...原创 2018-12-26 18:56:18 · 245 阅读 · 0 评论 -
机器学习之逻辑回归错误总结
最近在使用RandomizedLogisticRegression(RLR)随机逻辑回归模型方法筛选出主要特征。 1.错误一:This solver needs samples of at least 2 classes in the data, but the data contains 1 class 原因是样本数据量太少,不够进行机器学习。 解决方案是增加样本数据就好。 2.错误一:Inde...原创 2018-12-19 18:50:45 · 2178 阅读 · 0 评论