自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

飞歌商业智能工作室

数据挖掘统计分析数据仓库

  • 博客(7)
  • 收藏
  • 关注

原创 经典ID3算法

经典ID3算法1.背景知识:       决策树是对数据进行分类,以此达到预测的目的。该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。       决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决

2007-09-11 09:06:00 1991

原创 员工忠诚度分析

一、什么是员工忠诚度企业通过管理所形成的一种新的内部秩序。在这种新的秩序下,员工不仅能够认识到企业所面临的竞争性挑战,而且愿意承担迎接这种挑战的任务以换取相应的报酬,但是有一点是肯定的,即他们不会再一味地承诺对企业的忠诚终身不变了。二、为什么要进行员工忠诚度管理员工的忠诚是企业发展的基石,对于企业弥足珍贵。忠诚的员工必然在工作中释放他们的最大潜能,为企业创造更大的价值。是衡量企业管理好

2007-08-17 23:53:00 870

原创 11步成功建立数据仓库

  越来越多的公司使用数据仓库作为他们赢得新客户、开发新产品及降低成本的战略性工具。

2007-08-08 20:25:00 585

原创 聚类分析

 聚类分析---谱科聚类分析一、基本思想及意义意义:聚类分析是研究分类问题的多元数据分析方法。聚类分析有极其广泛的应用背景。在经济学中,为了了解不同地区的城镇居民的收入及消费情况,往往需要划分不同的类型去研究;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品、二等品等;在生物学中,要根据各生物体的综合特征进行分类;又如在考古中,要将某些古生物化石进行科学的分类等等。

2007-08-07 20:17:00 2064

原创 离差

 一、概念  数值型数据围绕其平均值分布的分数与集中程度,称为数据的离差或者变差。二、根据不同的度量可以定义不同的离差(或者变差)  最常用的有:全距、平均偏差、半内四分位数间距、10-90百分位数间距和标准差。  1)全距:一组数中的最大数与最小数和差。  2)平均偏差:N个数x1,x2,……,xn的平均偏差,简记为MD  3)半内四分位数间距:Q*=(Q3-Q1)/2

2007-08-05 00:13:00 1629

原创 四天oracle亚太地区体会

 1、虽然这几天的气温是上海73年来的最高记录,但是一点也没有影响这次展会.2、感觉这次是oracle想展示自己,而且还把小的公司拉来提供赞助,同时还要把他们比下去。3、做软件,也要有品牌效应,对于纯数据挖掘的东西,未必是oracle的最好,但是像一些大的企业他们如果想用BI这块东西的话,他们一定会是首先oracle,当时发现国内的中海油还有外国的一些客户只去光顾oracle的展区,至少其

2007-08-03 23:31:00 613

原创 数据挖掘在零售行业中的应用

1、主要使用OLAP技术对商品销售和库存进行分析.>2、使用关联规则对销售单据(用户交易记录进行关联分析,既可以得到当地用户消费特性,也可以得到商品之间的关联性,进行捆绑销售、决定货架摆放等。3、使用聚类对客户进行细分,分析细分后的客户特征,进行针对性的销售和服务。4、可以对N条交易单据进行分析,求某两种商品之间的相关性,可能为正也可能为负。5、使用线性回归,对一些条件进行0-1量

2007-07-27 22:21:00 1577

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除