自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 皮尔逊相关系数的计算(python代码)

点击打开链接

2016-07-06 16:30:11 2277

原创 时间序列分析与预测

(*  ̄3) 时间序列:同一现象在不同时间的相继观察值排列而成的序列。 (*  ̄3) 平稳序列:基本上不存在趋势,在某个固定的水平上波动,虽然也有波动,但不存在某种规律,其波动可以看成随机的。 (*  ̄3) 非平稳序列:包含趋势性、季节性或者周期性的序列。趋势可以是线性的,也可以是非线性的。 (*  ̄3) 时间序列预测的传统方法:1、简单平均法;2、移动平均法:包括简单移动平均法(以T为移动

2016-05-21 16:32:29 953 1

原创 CART分类和回归树

(^U^)ノ~ CART算法根据类标号属性的类型,当类标号属性是连续型时,生成的模型是回归树;离散型则是分类树。 (^U^)ノ~ 不同于ID3算法可以产生多个分支,CART每次分裂只能产生两个分支,所以CART产生的决策树是一棵二叉树。 (^U^)ノ~ 杂度(不纯度):gini(t)=1 -( 各类数量在数据集中的概率)的平方和。 (^U^)ノ~ 标准问题集:所有候选分支方案的集合。   

2016-05-19 14:58:48 495

原创 数据挖掘(^_^机)

o(* ̄▽ ̄*)ゞ 定义:数据挖掘,又称为数据库知识发现,它是一个从大量数据中提取、挖掘未知的,有价值的模式、规律等知识的复杂过程。                        描述:按既定决策目标,对大量数据进行探索和分析,揭示隐藏的、未知的或验证已知属性,并进一步将其模型化的先进有效方法。                        区别:与传统数据分析(如查询、报表、联机应用分析)又

2016-05-17 15:18:17 241

原创 决策树sama

o(*≥▽≤)ツ  信息增益:特征A对训练数据集D的信息增益 g(D,A),定义为集合D的经验熵 H(D) 与特征A给定条件下D的经验条件熵 H(D|A) 之差,即                                                                                          g(D,A) = H(D) - H(D|A)

2016-05-12 15:48:35 266

原创 Python双子2X3

^_^)  print输出到文件          2X:    print >> man_file, man                       print >> other_file, other          3X:    print (man, file=man_file)                      print (other, file=other_fi

2016-05-07 14:49:16 205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除