自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Coding Life

做一些有用的技术笔记 发表一些高质量的论文翻译:-D

  • 博客(21)
  • 收藏
  • 关注

转载 第八章 AdaBoost算法(提高分类准确率)

AdaBoost是一种流行的提升(提高分类准确率的组合分类方法)算法。它是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器。算法本身是改变数据分布实现的,它根据每次训练集之中的每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改权值的新数据送给下层分类器进行训练,然后将每次训练得到的分类器融合起

2015-05-25 21:56:13 4469

转载 第九章 贝叶斯信念网络分类

朴素贝叶斯分类有一个限制条件,就是假定类条件独立(即给定元组的类标号,假定属性的值可以条件地相互独立)。当这个条件成立时,朴素贝叶斯分类法的准确率是最高的。然而,在实践中,变量(属性)之间可能存在依赖关系,这样就限制了朴素贝叶斯分类的能力。贝叶斯信念网络说明联合条件概率分布,它提供一种因果关系的图形模型,可以在其上进行学习。它不要求所有的属性集都条件独立,而允许一部分属性条件独立。训练后的贝叶斯信

2015-05-25 21:55:32 6302

转载 第八章 基于规则的分类

1、使用IF-THEN规则分类        规则是表示信息或少量知识的好方法。基于规则的分类器使用一组IF—THEN规则进行分类。一个IF—THEN规则是一个如下的表达式:                                                                                                      IF条

2015-05-25 21:54:57 9090 1

转载 第九章 后向传播算法(分类)

1、神经网络        后向传播(Back—PropagationNetwork,简称BP网络)是一种神经网络学习算法。        神经网络最早是由心理学家和神经学家开创的,旨在寻求开发和检验神经的计算模拟。粗略地说,神经网络是一组连接的输入/输出单元,其中每个连接都与一个权重相关联。在学习阶段,通过调整这些权重,使得它能够正确预测输入样本的类标号。       

2015-05-25 21:54:34 12667

转载 第八章 朴素贝叶斯分类法

前言:贝叶斯分类包括朴素贝叶斯分类和贝叶斯信念网络分类。本章介绍朴素贝叶斯分类,第九章将会介绍贝叶斯信念网络分类。1、贝叶斯定理1.1 条件概率:                                                   P(X|H) 表示事件H已经发生的前提下,事件X发生的概率,叫做事件H发生下事件X的条件概率。

2015-05-25 21:54:10 1292

转载 第八章 决策树算法

1、什么是决策树?        决策树是一种类似于流程图的树结构。其中,每个内部结点(非树叶结点)表示在一个属性上的测试,每个分枝代表该测试的一个输出,而每个树叶结点存放一个类标号。树的最顶层结点是根节点。内部结点用矩形表示,而叶结点用椭圆表示。决策树可以是二叉的,也可以是非二叉的(根据不同的决策树算法而定)。一棵典型的决策树如下图:2、如何使用决策树

2015-05-25 21:53:27 12149

转载 分类和聚类的区别及各自的常见算法

1、分类和聚类的区别:        Classification (分类),对于一个classifier,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做supervised learning (监督学习),        Cluster

2015-05-25 21:52:24 22156

转载 第六章 挖掘频繁模式、关联和相关性:基本概念和方法

6.1 基本概念6.1.1  频繁模式        频繁模式是频繁地出现在数据集中的模式(如项集、子序列或子结构)。        频繁项集:频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合。        频繁子序列:一个子序列,如首先购买PC,然后是数码相机,再后是内存卡,如果它频繁地出现在购物历史数据库中,则称它为一个(频繁的)序列模式。 

2015-05-25 21:49:42 3364

转载 第六章FP-Growth

海量数据下,Apriori算法的时空复杂度都不容忽视。        1)空间复杂度:如果L1数量达到104的量级,那么C2中的候选项将达到107的量级。        2)时间复杂度:每计算一次Ck就需要扫描一遍数据库。        此时,人们希望设计一种方法,“挖掘全部频繁项集而无须这种代价昂贵的候选产生过程”。一种试图这样做的有趣的方法称为频繁模式增长(FP-Gro

2015-05-25 21:47:56 1699

转载 第六章Apriori算法

1、Apriori算法介绍        Apriori算法是Agrawal和R.Srikant于1994年提出的,为布尔关联规则挖掘频繁项集的原创性算法。算法的名字基于这样的事实:算法使用频繁项集性质的先验知识。        Apriori算法使用一种称为逐层搜索的迭代算法,其中k项集用于探索(k+1)项集。首先,通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出

2015-05-25 21:46:35 1696

转载 第三章 数据预处理

当今现实世界的数据库极易受噪声、缺失值和不一致数据的侵扰,因为数据库太大(常常多达数兆兆字节,甚至更多)。“如何对数据进行预处理,提高数据质量,从而提高挖掘结果的质量? 如何对数据预处理,使得挖掘过程更加有效、更加容易?”        有大量数据预处理技术。数据清理可以清除数据中的噪声,纠正不一致。数据集成将数据由多个数据源合并成一致的数据存储,如数据仓库。数据归约可以通过如聚集、删

2015-05-25 21:41:17 44428 1

转载 第二章 认识数据

1、数据对象与属性类型        数据集由数据对象组成。一个数据对象代表一个实体。例如,在销售数据库中,对象可以是顾客、商品或销售。        通常,数据对象用属性描述。数据对象又称样本、实例、数据点或对象。        如果数据对象存放在数据库中,则它们是数据元组。也就是说,数据库的行对应于数据对象,而列对应于属性。1.1  什么是属性 

2015-05-25 21:38:47 5482

转载 第一章 转自DQ_DM

1、为什么进行数据挖掘        我们生活在大量数据日积月累的年代。分析这些数据是一种重要需求。1.1  迈向信息时代        一种流行的说法是“我们生活在信息时代”。然而,实际上我们生活在数据时代。数据的爆炸式增长、广泛可用和巨大数量使得我们的时代成为真正的数据时代。        急需功能强大和通用的工具,以便从这些海量数据中发现有价值的信息,把这些数

2015-05-25 21:38:12 1078

转载 字符串匹配的KMP算法

字符串匹配是计算机的基本任务之一。  举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"?  许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一。它以三个发明者命名,起头的那个K就是著名科学家Donald Knuth。  这种算法不太容易理解,网上有很多解释,

2015-05-21 11:37:21 305

转载 vector的reserve和resize

vector 的reserve增加了vector的capacity,但是它的size没有改变!而resize改变了vector的capacity同时也增加了它的size!原因如下:      reserve是容器预留空间,但在空间内不真正创建元素对象,所以在没有添加新的对象之前,不能引用容器内的元素。加入新的元素时,要调用push_back()/insert()函数。      r

2015-05-07 17:37:12 316

转载 [leetcode]Gray Code

The gray code is a binary numeral system where two successive values differ in only one bit. Given a non-negative integer n representing the total number of bits in the code, print the sequence of gra

2015-05-07 17:13:19 357

转载 leetcode Climbing Stairs

You are climbing a stair case. It takes n steps to reach to the top.Each time you can either climb 1 or 2 steps. In how many distinct ways can you climb to the top?原题链接:https://oj.leetcode.com

2015-05-07 16:35:00 409

转载 leetcode Plus One

【题目】Given a number represented as an array of digits, plus one to the number.【题意】给你一个用数组表示的数,求加一之后的结果,结果还是用数组表示。【分析】从低位到高位,连续遇到9才能加一进位。【代码1】/********************************** 日期:20

2015-05-07 16:19:36 346

转载 三次握手和四次握手

建立TCP需要三次握手才能建立,而断开连接则需要四次握手。整个过程如下图所示:先来看看如何建立连接的。首先Client端发送连接请求报文,Server段接受连接后回复ACK报文,并为这次连接分配资源。Client端接收到ACK报文后也向Server段发生ACK报文,并分配资源,这样TCP连接就建立了。那如何断开连接呢?简单的过程如下:

2015-05-06 01:11:03 421

转载 解决错误:Call requires API level 11 (current min is 8): new android.app.Fragment

在新建碎片时,import android.app.Fragment;会提示此错误。【错误描述】    在用Eclipse开发过程中,为了兼容Android2.2和4.0以上版本,我在使用Notification类时做了2个版本的代码,代码根据系统版本不同执行相应模块,结果,等我输完代码,发现系统提示了一个这么的错误。【原因分析】    不详,可能和Run An

2015-05-02 21:47:44 776

原创 报错:The method setOnClickListener(View.OnClickListener) in the type View is not applicable for the ar

Button button1 = (Button) findViewById(R.id.button_1);button1.setOnClickListener(new OnClickListener() {@Overridepublic void onClick(View v) {Toast.makeText(FirstActivity.this, "You clicked Button

2015-05-01 01:59:00 2457

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除