自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 朴素贝叶斯分类

概要:是一种分类算法。 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。 应用场景:   分类。 优点:朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练对缺失数据不太敏感,

2017-04-13 18:37:38 436

原创 聚类分析

概要:聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性(同质性)越大,组间差别越大,聚类就越好。  应用场景:   聚类。聚类分析的3种大类和其代表技术:划分聚类法。K均值。是基于原型的、划分的聚类技术。它试图发现用户

2017-04-13 18:36:09 10038

原创 KNN最近邻

概要:是一种分类算法。 给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。 应用场景:   分类。 优点:简单,易于实现,无需估计参数,无需训练。新样本添加无需训练,是在线更新。 缺点:KNN算法是懒惰学习方法,分类的速度比积极学习

2017-04-13 18:34:28 389

原创 决策树

概要:是一种分类算法,它基于特征对实例进行分类。决策树的学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。 应用场景:   分类。 优点:模型具有可读性、准确性高。 分类速度快。 缺点:处理缺失值有困难。存在过拟合的问题。对噪声敏感。  关于特征选择:计算每一个特征的信息增益(或信

2017-04-13 18:33:36 571

原创 Logistic 回归

概要:logistic回归是一种分类方法,主要用于两分类问题。把线性模型的结果压缩到[0,1]之间,使其拥有了概率意义。 应用场景:   分类。 优点:实现简单,广泛地应用于工业问题上。分类时计算量非常小,速度很快,存储资源低。便利的观测样本概率分数。 缺点:当特征空间很大时,性能不是很好。容易欠拟合,一般

2017-04-13 18:28:57 256

原创 支持向量机

概要:是一种二元分类模型,线性分类和非线性分类都支持。经过演进,SVM也可以支持多元分类,同时经过扩展,也能应用于回归问题。 应用场景:   分类。 优点:可以解决小样本情况下的机器学习问题。可以提高泛化能力。可以解决高维问题。可以解决非线性问题。 缺点:对缺失数据敏感。 对非线性问题没有通用解决方案,必须

2017-04-13 18:20:19 3280

原创 人工神经网络

概要:人工神经网络是一种模拟大脑神经元的计算机结构。人们用神经网络来建立模型,使用模型来训练数据,最后可以使得模型具备某种人们想要的预测分类的能力。  应用场景:    分类。 优点:可以充分逼近任意复杂的非线性关系。 所有定量或定性的信息都等势分布贮存于网络内的各神经元,故有很强的鲁棒性和容错性。采用并行分布处理方法,使得快

2017-04-13 18:13:58 3432

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除