2015年07月_猴子数据分析

07月

原创数据分析之美：决策树

信息熵信息熵（Entropy）是指：一组数据所包含的信息量，使用概率来度量。数据包含的信息越有序，所包含的信息越低；数据包含的信息越杂，包含的信息越高。例如在极端情况下，如果数据中的信息都是0，或者都是1，那么熵值为0，因为你从这些数据中得不到任何信息，或者说这组数据给出的信息是确定的。如果数据时均匀分布，那么他的熵最大，因为你根据数据不能知晓那种情况发生的可能性比较大。信息熵单位

2015-07-30 16:35:55 2351

原创数据分析之美：决策树R语言实现

R语言实现决策树 1.准备数据 > install.packages("tree") > library(tree) > library(ISLR) > attach(Carseats) > High=ifelse(Sales<=8,"No","Yes") //set high values by sales data to calssify > Carseats=data.frame(Car

2015-07-30 16:18:51 14724 1

原创数据分析之美：如何进行回归分析

1. 确定自变量与Y是否相关证明：自变量X1，X2，....XP中至少存在一个自变量与因变量Y相关 For any given value of n（观测数据的数目） and p（自变量X的数目）, any statistical software package can be used to compute the p-value associated with the F-stat

2015-07-29 21:39:40 15939 1

原创 Resample Methods for Training Error & Test Error

Why use resample methods Resampling methods are an indispensable tool in modern statistics. They involve repeatedly drawing samples from a training set and refitting a model of interest on each sam

2015-07-19 16:46:35 2241

Head First设计模式，非常经典的设计模式教程。《Head First设计模式》共有14章，每章都介绍了几个设计模式，完整地涵盖了四人组版本全部23个设计模式。前言先介绍这本书的用法；第1章到第11章陆续介绍的设计模式为Strategy、Observer、Decorator、Abstract Factory、Factory Method、Singleton、Command、Adapter、Facade、Templat Method、Iterator、Composite、 State、Proxy。最后三章比较特别。第12章介绍如何将两个以上的设计模式结合起来成为新的设计模式（例如著名的MVC模式），作者称其为复合设计模式（这是作者自创的名称，并非四人组的标准名词），第13章介绍如何进一步学习设计模式，如何发觉新的设计模式等主题，至于第14章则很快地浏览尚未介绍的设计模式，包括Bridge、Builder、Chain of Responsibility、 Flyweight、Interpreter、Mediator、Memento、Prototype、Visitor。第1章还介绍了四个OO基本概念（抽象、封装、继承、多态），而第１章到第9章也陆续介绍了九个OO原则（Principle）。千万不要轻视这些OO原则，因为每个设计模式背后都包含了几个OO原则的概念。很多时候，在设计时有两难的情况，这时候我们必须回归到OO原则，以方便判断取舍。可以这么说：OO原则是我们的目标，而设计模式是我们的做法。

2013-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

公众号（猴子数据分析）

原创数据分析之美：决策树

原创数据分析之美：决策树R语言实现

原创数据分析之美：如何进行回归分析

原创 Resample Methods for Training Error & Test Error

MapReduce 编程模型

Head First Design Patterns

Data.Structures.and.Algorithms.in.Java, (Robert Lafore).2nd.Ed

Google File System

linux每日自动备份脚本

观察者模式模版和例子

GenetworkClient

空空如也

原创 数据分析之美：决策树

原创 数据分析之美：决策树R语言实现

原创 数据分析之美：如何进行回归分析

原创 Resample Methods for Training Error & Test Error

MapReduce 编程模型

Head First Design Patterns

Data.Structures.and.Algorithms.in.Java, (Robert Lafore).2nd.Ed

Google File System

linux每日自动备份脚本

观察者模式模版和例子

GenetworkClient

空空如也

原创数据分析之美：决策树

原创数据分析之美：决策树R语言实现

原创数据分析之美：如何进行回归分析