自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

转载 Clementine决策树算法C&RT、CHAID、QUEST、C5.0的区别 决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,

Clementine决策树算法C&RT、CHAID、QUEST、C5.0的区别决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。优点:  1) 可以生成可以理解的规则;  2) 计算量相对来说不是很大;  3) 可以处理连续和种

2016-11-12 19:21:34 1525

转载 kmeans++算法

http://www.jb51.net/article/49395.htm

2016-10-27 17:12:03 417

转载 kmeans和kmeans++算法的区别

K-Means介绍       K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示:        如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样

2016-10-27 16:53:53 6489

转载 数据挖掘十大算法总结--核心思想,算法优缺点,应用领域

时间 2014-11-03 10:43:01  CSDN博客原文  http://blog.csdn.net/iemyxie/article/details/40736773本文所涉算法均只概述核心思想,具体实现细节参看本博客“数据挖掘算法学习”分类下其他文章,不定期更新中。转载请注明出处,谢谢。参考了许多资料加上个人理解,对十大算法进行如下分类:•分类算法:C

2016-09-16 13:37:09 455

转载 EM算法

(EM算法)The EM Algorithm      EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式      回顾优化理论中的一些概念。设f是定义域为实

2016-09-16 12:27:41 347

转载 离群点检测方法综述

离群点检测方法综述异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。离群点检测已经被广泛应用于电信和信用卡的诈骗检测、贷款审批、电子商务、网络入侵、天气预报等领域,如可以利用离群点检测分析运

2016-09-09 10:34:40 8524

转载 R语言连接TeradataDB

第一步:从Teradata官方网站下载JDBC driver第二步:把Driver放在一个目录下(我放在D:\R\JDBC)第三步:为R安装RJDBC package    install.packages("RJDBC")安装成功后,可以键入如下代码进行连接Teradata:> library(RJDBC)> jdbc.drv>

2016-08-26 14:34:52 992

转载 SQL中的CASE WHEN用法

Java代码  SQL中Case的使用方法          Case具有两种格式。简单Case函数和Case搜索函数。         --简单Case函数         CASE sex                   WHEN '1' THEN '男'                   WHEN '2' THEN '女'      

2016-07-28 11:23:24 232

转载 SQL Server数据库ROW_NUMBER()函数使用详解

SQL Server数据库ROW_NUMBER()函数的使用是本文我们要介绍的内容,接下来我们就通过几个实例来一一介绍ROW_NUMBER()函数的使用。实例如下:1.使用row_number()函数进行编号,如select email,customerID, ROW_NUMBER() over(order by psd) as rows from QT_Customer原

2016-07-28 11:10:59 741

转载 oracle add_months函数的用法

如果需要取上一个月的数据,并且每天都要进行此操作,每次都需要改时间,的确非常的麻烦,所以想到了oracle add_months函数这个函数oracle add_months函数:oracle add_months(time,months)函数可以得到某一时间之前或之后n个月的时间如 select add_months(sysdate,-6) from dual; 该查询的

2016-07-28 11:07:30 1029

转载 sql中的cast函数

本文导读:CAST函数用于将某种数据类型的表达式显式转换为另一种数据类型。CAST()函数的参数是一个表达式,它包括用AS关键字分隔的源值和目标数据类型。一、语法:CAST (expression AS data_type)参数说明:expression:任何有效的SQServer表达式。AS:用于分隔两个参数,在AS之前的是要处理的数据,在AS之后

2016-07-28 10:54:12 475

转载 查找异常值的方法

Spss中异常值检查方法:Spss中异常值检查方法:检查异常值方法1:       最常用的方法就是对变量进行排序,这也是最简单的方法。排序后对照最大值和最小值、全距等统计量可以看出数据的离群状况。 检查异常值方法2:       散点图的优势就在于直观的呈现两两变量间的关系,尤其在两变量间的线性关联比较强的时候,如果有离群值,图形侦察的结果

2016-05-20 10:24:11 15284

转载 各分类算法优缺点

各种分类算法比较最近在学习分类算法,顺便整理了各种分类算法的优缺点。1决策树(Decision Trees)的优缺点决策树的优点:一、           决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、           对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余

2016-05-12 14:08:13 492

转载 各类算法的优缺点

各种分类算法比较最近在学习分类算法,顺便整理了各种分类算法的优缺点。1决策树(Decision Trees)的优缺点决策树的优点:一、           决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、           对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余

2016-05-12 14:06:14 1355

转载 R文本挖掘

【R语言】Rwordseg/rJava包的安装 (2015-10-31 23:29:21)转载▼标签: 育儿分类: 【R语言】1、Rwordseg包安装及加载(1) install.packages("Rwordseg")(2)install.packages("Rwordseg", repos

2016-03-24 16:41:42 446

转载 R语言读写文件

R语言数据文件读写R语言数据储存与读取1 首先用getwd() 获得当前目录,用setwd("C:/data")设定当前目录 2 数据保存创建数据框d>d data.frame(obs = c(1, 2, 3), treat = c("A", "B", "A"), weight = c(2.3, NA, 9))2.1 保存为简单文本>write.

2016-03-24 14:33:55 1688

转载 R语言时间处理

> d > difftime(d[2],d[1])Time difference of -103.8431 days> strptime(d, "%Y-%m-%d %H:%M:%S")[1] "2013-12-05 18:43:00 JST" "2013-08-23 22:29:00 JST"> difftime(strptime(d, "%Y-%m-%d

2016-03-24 11:01:19 412

转载 R语言日期数据处理

R语言学习笔记:日期处理1、取出当前日期Sys.Date()[1] "2014-10-29"date()  #注意:这种方法返回的是字符串类型[1] "Wed Oct 29 20:36:07 2014"2、在R中日期实际是double类型,是从1970年1月1日以来的天数typeof(Sys.Date())[1] "double"3、转换为日期

2016-03-24 10:43:38 844

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除