自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

原创 正则化解决过拟合问题

关于正则化,以下引自李航博士《统计学习方法》1.5节关于正则化的一些描述:模型选择的典型方法是正则化。正则化是结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularizer)或罚项(penalty term)。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如,正则化项可以是模型参数向量的范数。正则化符合奥卡姆剃刀(Occam's razor)原理

2015-07-24 14:54:51 2070

转载 大数据之简介

要理解大数据这一概念,首先要从”大”入手,”大”是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。大数据特点第一,数据体量巨大。从TB级别,跃升到PB级别。第二,数据类型繁多,如前文提到

2015-07-22 17:38:50 873

转载 大数据处理分析的工具介绍

HadoopHadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Ha

2015-07-22 11:36:47 734

原创 过拟合问题简述

关于过度拟合的概念:给定一个假设空间H,一个假设h∈H,如果存在其他的假设h’∈H,使得在训练样例上h的错误率比h‘小,但在整个实例分布上h’的错误率比h小,那么就说假设h过度拟合训练数据过滤拟合可能的原因:(1)使用过于复杂的模型(dvc 很大);(2)数据噪音;(3)有限的训练数据。详细解释:1、所使用的模型对数据集来说过于复杂,以至于该模型不能很好地解释这些数据,把很简单的数

2015-07-22 09:51:12 843

原创 分类问题 boosting思想

Boosting思想:Boosting方法不是一种特定的学习方法,而是一种在已有的学习方法基础上进行“投票”的方式。具体说来,它是对已有的若干分类器(可谓同类或者异类,且分类效果不死很好,比较弱)进行加权求和得到最终的分类器。虽然从理论上来说, 任何机器学习方法都可以作为Boosting 方法的弱学习器,在实际中,Boosting的弱规则常采用基于规则的方法。Boosting通过关注弱规则

2015-07-20 17:49:26 2154

转载 分类问题 特征向量的归一化方法

下面介绍几种归一化的方法:  1、线性函数转换,表达式如下:    y=(x-MinValue)/(MaxValue-MinValue)  2、对数函数转换,表达式如下:    y=log10 (x)  3、反余切函数转换 ,表达式如下:    y=arctan(x)*2/PI  4、减去均值,乘以方差:    y=(x-means)

2015-07-20 17:34:57 6569 6

原创 libsvm中java.lang.NoSuchFieldException: rand

libsvm中java.lang.NoSuchFieldException: rand

2015-07-18 21:19:53 750

原创 java.lang.Exception: libsvm classes not in CLASSPATH!问题解决方法

weka中svm的使用

2015-07-18 18:06:54 1439

转载 java排列组合算法

一.利用二进制状态法求排列组合,此种方法比较容易懂,但是运行效率不高,小数据排列组合可以使用二.用递归的思想来求排列跟组合,代码量比较大三.利用动态规划的思想求排列和组合下面是求排列

2015-07-13 16:40:45 6533

转载 java错误Comparison method violates its general contract!

今天用到Collections.sort();方法时,提示错误如下:网上查到一个解释:Description: The sorting algorithm used by java.util.Arrays.sort and (indirectly) by java.util.Collections.sort has been replaced. The new sort imp

2015-07-08 16:57:55 889

转载 java垃圾回收机制(二)

4. finalize()方法      在JVM垃圾回收器收集一个对象之前,一般要求程序调用适当的方法释放资源,但在没有明确释放资源的情况下,Java提供了缺省机制来终止该对象心释放资源,这个方法就是finalize()。它的原型为:  protected void finalize() throws Throwable  在finalize()方法返回之后,对象消失,垃圾收集开

2015-07-03 17:27:25 558

转载 java 垃圾回收机制(一)

在C++里,释放内存是手动处理的,要用delete运算符来释放分配的内存。这是流行的说法。确切地说,是应用认为不需要某实体时,就需用delete告诉系统,可以回收这块空间了。这个要求,对编码者来说,是件很麻烦、很难做到的事。而在Java中,当没有对象引用指向原先分配给某个对象的内存时,该内存便成为垃圾。JVM的一个系统级线程会自动释放该内存块。垃圾回收意味着程序不再需要的对象是"无用信息",这些信

2015-07-03 17:11:38 496

java开发hbase-1.2.1所需的jar包

java开发hbase-1.2.1所需的jar包

2016-08-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除