- 博客(6)
- 收藏
- 关注
原创 时间序列分析与预测
(*  ̄3) 时间序列:同一现象在不同时间的相继观察值排列而成的序列。 (*  ̄3) 平稳序列:基本上不存在趋势,在某个固定的水平上波动,虽然也有波动,但不存在某种规律,其波动可以看成随机的。 (*  ̄3) 非平稳序列:包含趋势性、季节性或者周期性的序列。趋势可以是线性的,也可以是非线性的。 (*  ̄3) 时间序列预测的传统方法:1、简单平均法;2、移动平均法:包括简单移动平均法(以T为移动
2016-05-21 16:32:29 953 1
原创 CART分类和回归树
(^U^)ノ~ CART算法根据类标号属性的类型,当类标号属性是连续型时,生成的模型是回归树;离散型则是分类树。 (^U^)ノ~ 不同于ID3算法可以产生多个分支,CART每次分裂只能产生两个分支,所以CART产生的决策树是一棵二叉树。 (^U^)ノ~ 杂度(不纯度):gini(t)=1 -( 各类数量在数据集中的概率)的平方和。 (^U^)ノ~ 标准问题集:所有候选分支方案的集合。
2016-05-19 14:58:48 495
原创 数据挖掘(^_^机)
o(* ̄▽ ̄*)ゞ 定义:数据挖掘,又称为数据库知识发现,它是一个从大量数据中提取、挖掘未知的,有价值的模式、规律等知识的复杂过程。 描述:按既定决策目标,对大量数据进行探索和分析,揭示隐藏的、未知的或验证已知属性,并进一步将其模型化的先进有效方法。 区别:与传统数据分析(如查询、报表、联机应用分析)又
2016-05-17 15:18:17 241
原创 决策树sama
o(*≥▽≤)ツ 信息增益:特征A对训练数据集D的信息增益 g(D,A),定义为集合D的经验熵 H(D) 与特征A给定条件下D的经验条件熵 H(D|A) 之差,即 g(D,A) = H(D) - H(D|A)
2016-05-12 15:48:35 266
原创 Python双子2X3
^_^) print输出到文件 2X: print >> man_file, man print >> other_file, other 3X: print (man, file=man_file) print (other, file=other_fi
2016-05-07 14:49:16 205
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人