自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 收藏的一些博文

SVD   http://wenku.baidu.com/link?url=dqorn6e4Cm0GrOO9oKc0f8R9B-xDiWJyvDlRHAhLeDHhdO40AX03Y6lBA6WCCQCLoNzxjvhMlfcE0D3bCDf42bmWNCQvB5qk4E0Lcuin5zS正则表达式  http://www.cnblogs.com/huxi/archive/2010/0

2015-07-28 17:06:28 431

转载 后剪枝之悲观剪枝法

转自http://blog.csdn.net/woshizhouxiang/article/details/17679015把一颗子树(具有多个叶子节点)的分类用一个叶子节点来替代的话,在训练集上的误判率肯定是上升的,但是在新数据上不一定。于是我们需要把子树的误判计算加上一个经验性的惩罚因子。对于一颗叶子节点,它覆盖了N个样本,其中有E个错误,那么该叶子节点的错误率为(E+0.5)/N

2015-07-23 16:57:01 8776 6

转载 后剪枝技术之代价复杂性剪枝

参考博文http://blog.csdn.net/tianguokaka/article/details/9018933在分类回归树中可以使用的后剪枝方法有多种,比如:代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等。这里我们只介绍代价复杂性剪枝法。对于分类回归树中的每一个非叶子节点计算它的表面误差率增益值α。是子树中包含的叶子节点个数;是节点t的

2015-07-23 15:31:30 6974 2

原创 Apriori算法的python实现

def loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]def creatC1(dataSet): C1=[] C=[] for transaction in dataSet: C=C+transaction C=list(set(C)) for i in C:

2015-07-20 10:53:46 603

原创 层次聚类算法的python实现

文章给出层次聚类算法的python实现方法,并用《数据挖掘导论》里面的具体数据进行运行,代码如下:from numpy import *from math import *from operator import *def dist(a,b):#a,b is mat c=(a-b)*(a-b).T return sqrt(sum(c)) def centroid

2015-07-10 10:35:26 2791

转载 python正则表达式

http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白

2015-07-06 16:30:42 227

转载 windows上安装numpy和scipy

windows上安装numpy和scipy:http://sourceforge.net/projects/numpy/files/NumPyhttp://sourceforge.net/projects/scipy/files/Scipy下载和你Python版本相应对的exe文件安装即可。感觉这个最简单无脑了

2015-07-06 14:31:44 239

原创 怎样在CentOS下安装Python的numpy包和scipy包

yum直接安装sudo yum -y install gcc gcc-c++ numpy python-devel scipy千万记得centOS要连接网络。。。之前一直没联网,怎么都不行。。

2015-07-02 13:19:01 681

转载 Spark的transformations和actions操作解释

分布式数据集操作分布式数据集支持两种操作:转换(transformation):根据现有的数据集创建一个新的数据集动作(actions):在数据集上运行计算后,返回一个值给驱动程序例如,Map是一个转换,将数据集的每一个元素,都经过一个函数进行计算后,返回一个新的分布式数据集作为结果。而另一方面,Reduce是一个动作,将数据集的所有元素,用某个函数进行聚合,然

2015-07-01 16:10:16 1475

原创 初学Spark——关于安装Spark

折腾了两天多,终于把Spark安装成功。由于之前并非计算机专业,所以各个地方全是慢慢摸索。下面总结如下:1、windows环境下的Spark不会安装,转安装到linux系统下。2、安装VNWare,之后再安装centOs7.03、安装流程主要参考zhangyuming010的博文,以后也打算长期研究他的博文。http://blog.csdn.net/zhangyuming010/art

2015-07-01 14:08:22 288

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除