自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

moving

痴迷Python,专注数据分析、机器学习、数据挖掘

  • 博客(6)
  • 收藏
  • 关注

原创 第九章 基于案例的推理(CBR)分类法

基于案例的推理(Case-BasedReasoning,简称CBR)是人工智能发展较为成熟的一个分支,它是一种基于过去的实际经验或经历的推理。对基于案例的推理来说,求解一个问题的结论是从记忆里或案例库中找到与当前问题最相关的案例,然后对该案例做必要的改动以适合当前需解决的问题。1、CBR简介1.1  CBR的概念简而言之,CBR基于这样一个观察事实:人们在解决问题时总是首先试图从以往经

2014-09-26 08:48:07 25826

原创 第九章 KNN(K最近邻分类算法)

1、惰性学习法        说到惰性学习法,就要提到急切学习法。急切学习法:给定训练集, 在接收待分类的新元祖(如检验元组)之前,就构造泛化(即分类)模型。如:决策树归纳、贝叶斯分类、基于规则的分类、后向传播分类、支持向量机和基于关联规则挖掘的分类等。惰性学习法(也称为基于实例的学习法):给定一个训练元组,简单地存储它 (或只是稍加处理) ,一直等到给定一个检验元组。仅当看到检验元组

2014-09-24 09:50:42 7805

原创 第九章 频繁模式分类

1、频繁模式        频繁模式显示了频繁地出现在给定数据集上的属性——值对之间的有趣联系。        例如,我们可能发现属性——值对age=youth和credit=OK出现在20%的购买计算机的AllRlectronics顾客元组中。        我们可以把每个属性——值对看作一个项,因此搜索这种频繁模式称作频繁模式挖掘或频繁项集挖掘。2、支持度、置信度     

2014-09-24 09:39:59 2446

原创 第九章 SVM(支持向量机)

支持向量机(SVM),一种对线性和非线性数据进行分类的方法。简单的说,SVM是一种算法(其实不能说,SVM是一个分类器,因为它也可以用来做回归)。工作过程:使用一种非线性映射,把原训练数据映射到较高的维上。在新的维上,它搜索最佳分离超平面(即将一个类的元组与其他类分离的“决策边界”)。使用到足够高维上的、合适的非线性映射,两个类的数据总是可以被超平面分开。SVM使用支持向量(“基本”训练元

2014-09-24 09:26:20 875

原创 第八章 分类:基本概念

8.1 基本概念8.1.1  什么是分类分类是一种重要的数据分析形式,它提取刻画重要数据类的模型。这种模型称为分类器,预测分类的(离散的、无序的)类标号。这些类别可以用离散值表示,其中值之间的次序没有意义。8.1.2  分类的一般方法       数据分类是一个两阶段过程:(1)学习阶段(构建分类模型)(2)分类阶段(使用模型预测给定数据的类标号)      在

2014-09-17 14:49:48 3754

原创 第八章 AdaBoost算法(提高分类准确率)

AdaBoost是一种流行的提升(提高分类准确率的组合分类方法)算法。它是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器。算法本身是改变数据分布实现的,它根据每次训练集之中的每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改权值的新数据送给下层分类器进行训练,然后将每次训练得到的分类器融合起

2014-09-16 16:26:40 4757

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除