收藏的一些博文

SVD   http://wenku.baidu.com/link?url=dqorn6e4Cm0GrOO9oKc0f8R9B-xDiWJyvDlRHAhLeDHhdO40AX03Y6lBA6WCCQCLoNzxjvhMlfcE0D3bCDf42bmWNCQvB5qk4E0Lcuin5zS ...

2015-07-28 17:06:28

阅读数 261

评论数 0

后剪枝之悲观剪枝法

转自http://blog.csdn.net/woshizhouxiang/article/details/17679015 把一颗子树(具有多个叶子节点)的分类用一个叶子节点来替代的话,在训练集上的误判率肯定是上升的,但是在新数据上不一定。于是我们需要把子树的误判计算加上一个经验性的惩...

2015-07-23 16:57:01

阅读数 5422

评论数 6

后剪枝技术之代价复杂性剪枝

参考博文http://blog.csdn.net/tianguokaka/article/details/9018933 在分类回归树中可以使用的后剪枝方法有多种,比如:代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等。这里我们只介绍代价复杂性剪枝法。 对于分类回归树中的每一...

2015-07-23 15:31:30

阅读数 4340

评论数 2

Apriori算法的python实现

def loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]] def creatC1(dataSet): C1=[] C=[] for transaction in dataSet: C=C...

2015-07-20 10:53:46

阅读数 346

评论数 0

层次聚类算法的python实现

文章给出层次聚类算法的python实现方法,并用《数据挖掘导论》里面的具体数据进行运行,代码如下: from numpy import * from math import * from operator import * def dist(a,b):#a,b is mat c=(a-b...

2015-07-10 10:35:26

阅读数 1397

评论数 0

python正则表达式

http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如...

2015-07-06 16:30:42

阅读数 155

评论数 0

windows上安装numpy和scipy

windows上安装numpy和scipy: http://sourceforge.net/projects/numpy/files/NumPy http://sourceforge.net/projects/scipy/files/Scipy 下载和你Python版本相应对的exe文件安装...

2015-07-06 14:31:44

阅读数 159

评论数 0

怎样在CentOS下安装Python的numpy包和scipy包

yum直接安装 sudo yum -y install gcc gcc-c++ numpy python-devel scipy 千万记得centOS要连接网络。。。之前一直没联网,怎么都不行。。

2015-07-02 13:19:01

阅读数 422

评论数 0

Spark的transformations和actions操作解释

分布式数据集操作 分布式数据集支持两种操作: 转换(transformation):根据现有的数据集创建一个新的数据集 动作(actions):在数据集上运行计算后,返回一个值给驱动程序 例如,Map是一个转换,将数据集的每一个元素,都经过一个函数进行计算后,返回一个新...

2015-07-01 16:10:16

阅读数 1071

评论数 0

初学Spark——关于安装Spark

折腾了两天多,终于把Spark安装成功。由于之前并非计算机专业,所以各个地方全是慢慢摸索。下面总结如下: 1、windows环境下的Spark不会安装,转安装到linux系统下。 2、安装VNWare,之后再安装centOs7.0 3、安装流程主要参考zhangyuming010的博文,以后...

2015-07-01 14:08:22

阅读数 196

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭