自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

公众号(猴子数据分析)

用知识改变命运,让家人过上体面的生活

  • 博客(4)
  • 资源 (11)
  • 收藏
  • 关注

原创 数据分析之美:决策树

信息熵信息熵(Entropy)是指:一组数据所包含的信息量,使用概率来度量。数据包含的信息越有序,所包含的信息越低;数据包含的信息越杂,包含的信息越高。例如在极端情况下,如果数据中的信息都是0,或者都是1,那么熵值为0,因为你从这些数据中得不到任何信息,或者说这组数据给出的信息是确定的。如果数据时均匀分布,那么他的熵最大,因为你根据数据不能知晓那种情况发生的可能性比较大。信息熵单位

2015-07-30 16:35:55 2297

原创 数据分析之美:决策树R语言实现

R语言实现决策树1.准备数据> install.packages("tree")> library(tree)> library(ISLR)> attach(Carseats)> High=ifelse(Sales<=8,"No","Yes") //set high values by sales data to calssify> Carseats=data.frame(Car

2015-07-30 16:18:51 14574 2

原创 数据分析之美:如何进行回归分析

1. 确定自变量与Y是否相关证明:自变量X1,X2,....XP中至少存在一个自变量与因变量Y相关For any given value of n(观测数据的数目) and p(自变量X的数目), any statistical software  package can be used to compute the p-value associated with the F-stat

2015-07-29 21:39:40 15711 1

原创 Resample Methods for Training Error & Test Error

Why use resample methodsResampling methods are an indispensable tool in modern statistics. They involve repeatedly drawing samples from a training set and refitting a model of interest on each sam

2015-07-19 16:46:35 2177

MapReduce 编程模型

MapReduce goole MapReduce编程模型

2013-09-08

Google File System

Google File System分布式文件系统

2013-09-08

观察者模式模版和例子

观测者模式的例子和模版源代码,方便使用者使用

2013-09-05

linux每日自动备份脚本

linux每日自动备份脚本,该脚本backupday.sh用来每日备份你需要备份的文件或目录

2013-06-30

GenetworkClient

本人开发的Genetwork客户端代码,实现了空间资源的添加、删除、修改和查找功能,方便Genetwork用户和开发者使用Genetwork

2013-06-10

Data.Structures.and.Algorithms.in.Java, (Robert Lafore).2nd.Ed

Data.Structures.and.Algorithms.in.Java, (Robert Lafore).2nd.Ed

2013-02-25

Head First Design Patterns

Head First设计模式,非常经典的设计模式教程。 《Head First设计模式》共有14章,每章都介绍了几个设计模式,完整地涵盖了四人组版本全部23个设计模式。前言先介绍这本书的用法; 第1章到第11章陆续介绍的设计模式为Strategy、Observer、Decorator、Abstract Factory、Factory Method、Singleton、Command、Adapter、Facade、Templat Method、Iterator、Composite、 State、Proxy。最后三章比较特别。第12章介绍如何将两个以上的设计模式结合起来成为新的设计模式(例如著名的MVC模式),作者称其为复合设计模式(这是作者自创的名称, 并非四人组的标准名词),第13章介绍如何进一步学习设计模式,如何发觉新的设计模式等主题,至于第14章则很快地浏览尚未介绍的设计模式,包括Bridge、Builder、Chain of Responsibility、 Flyweight、Interpreter、Mediator、Memento、Prototype、Visitor。第1章还介绍了四个OO基本概念(抽象、封装、继承、多态),而第1章到第9章也陆续介绍了九个OO原则(Principle)。 千万不要轻视这些OO原则,因为每个设计模式背后都包含了几个OO原则的概念。很多时候,在设计时有两难的情况,这时候我们必须回归到OO原则,以方便判断取舍。 可以这么说:OO原则是我们的目标,而设计模式是我们的做法。

2013-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除