- 博客(18)
- 收藏
- 关注
转载 Clementine决策树算法C&RT、CHAID、QUEST、C5.0的区别 决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,
Clementine决策树算法C&RT、CHAID、QUEST、C5.0的区别决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。优点: 1) 可以生成可以理解的规则; 2) 计算量相对来说不是很大; 3) 可以处理连续和种
2016-11-12 19:21:34 1541
转载 kmeans和kmeans++算法的区别
K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。其聚类过程可以用下图表示: 如图所示,数据样本用圆点表示,每个簇的中心点用叉叉表示。(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样
2016-10-27 16:53:53 6566
转载 数据挖掘十大算法总结--核心思想,算法优缺点,应用领域
时间 2014-11-03 10:43:01 CSDN博客原文 http://blog.csdn.net/iemyxie/article/details/40736773本文所涉算法均只概述核心思想,具体实现细节参看本博客“数据挖掘算法学习”分类下其他文章,不定期更新中。转载请注明出处,谢谢。参考了许多资料加上个人理解,对十大算法进行如下分类:•分类算法:C
2016-09-16 13:37:09 467
转载 EM算法
(EM算法)The EM Algorithm EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f是定义域为实
2016-09-16 12:27:41 355
转载 离群点检测方法综述
离群点检测方法综述异常对象被称作离群点。异常检测也称偏差检测和例外挖掘。离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。离群点检测已经被广泛应用于电信和信用卡的诈骗检测、贷款审批、电子商务、网络入侵、天气预报等领域,如可以利用离群点检测分析运
2016-09-09 10:34:40 8597
转载 R语言连接TeradataDB
第一步:从Teradata官方网站下载JDBC driver第二步:把Driver放在一个目录下(我放在D:\R\JDBC)第三步:为R安装RJDBC package install.packages("RJDBC")安装成功后,可以键入如下代码进行连接Teradata:> library(RJDBC)> jdbc.drv>
2016-08-26 14:34:52 1002
转载 SQL中的CASE WHEN用法
Java代码 SQL中Case的使用方法 Case具有两种格式。简单Case函数和Case搜索函数。 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女'
2016-07-28 11:23:24 243
转载 SQL Server数据库ROW_NUMBER()函数使用详解
SQL Server数据库ROW_NUMBER()函数的使用是本文我们要介绍的内容,接下来我们就通过几个实例来一一介绍ROW_NUMBER()函数的使用。实例如下:1.使用row_number()函数进行编号,如select email,customerID, ROW_NUMBER() over(order by psd) as rows from QT_Customer原
2016-07-28 11:10:59 747
转载 oracle add_months函数的用法
如果需要取上一个月的数据,并且每天都要进行此操作,每次都需要改时间,的确非常的麻烦,所以想到了oracle add_months函数这个函数oracle add_months函数:oracle add_months(time,months)函数可以得到某一时间之前或之后n个月的时间如 select add_months(sysdate,-6) from dual; 该查询的
2016-07-28 11:07:30 1040
转载 sql中的cast函数
本文导读:CAST函数用于将某种数据类型的表达式显式转换为另一种数据类型。CAST()函数的参数是一个表达式,它包括用AS关键字分隔的源值和目标数据类型。一、语法:CAST (expression AS data_type)参数说明:expression:任何有效的SQServer表达式。AS:用于分隔两个参数,在AS之前的是要处理的数据,在AS之后
2016-07-28 10:54:12 504
转载 查找异常值的方法
Spss中异常值检查方法:Spss中异常值检查方法:检查异常值方法1: 最常用的方法就是对变量进行排序,这也是最简单的方法。排序后对照最大值和最小值、全距等统计量可以看出数据的离群状况。 检查异常值方法2: 散点图的优势就在于直观的呈现两两变量间的关系,尤其在两变量间的线性关联比较强的时候,如果有离群值,图形侦察的结果
2016-05-20 10:24:11 15327
转载 各分类算法优缺点
各种分类算法比较最近在学习分类算法,顺便整理了各种分类算法的优缺点。1决策树(Decision Trees)的优缺点决策树的优点:一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余
2016-05-12 14:08:13 505
转载 各类算法的优缺点
各种分类算法比较最近在学习分类算法,顺便整理了各种分类算法的优缺点。1决策树(Decision Trees)的优缺点决策树的优点:一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余
2016-05-12 14:06:14 1373
转载 R文本挖掘
【R语言】Rwordseg/rJava包的安装 (2015-10-31 23:29:21)转载▼标签: 育儿分类: 【R语言】1、Rwordseg包安装及加载(1) install.packages("Rwordseg")(2)install.packages("Rwordseg", repos
2016-03-24 16:41:42 459
转载 R语言读写文件
R语言数据文件读写R语言数据储存与读取1 首先用getwd() 获得当前目录,用setwd("C:/data")设定当前目录 2 数据保存创建数据框d>d data.frame(obs = c(1, 2, 3), treat = c("A", "B", "A"), weight = c(2.3, NA, 9))2.1 保存为简单文本>write.
2016-03-24 14:33:55 1709
转载 R语言时间处理
> d > difftime(d[2],d[1])Time difference of -103.8431 days> strptime(d, "%Y-%m-%d %H:%M:%S")[1] "2013-12-05 18:43:00 JST" "2013-08-23 22:29:00 JST"> difftime(strptime(d, "%Y-%m-%d
2016-03-24 11:01:19 423
转载 R语言日期数据处理
R语言学习笔记:日期处理1、取出当前日期Sys.Date()[1] "2014-10-29"date() #注意:这种方法返回的是字符串类型[1] "Wed Oct 29 20:36:07 2014"2、在R中日期实际是double类型,是从1970年1月1日以来的天数typeof(Sys.Date())[1] "double"3、转换为日期
2016-03-24 10:43:38 859
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人