自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习之决策树(机器学习技法)

决策树决策树在集成学习中的地位整个集成学习会按照是否有线程的小的模型(g)分为两种。如果我们有g的话我们就会用blending。如果想一边学习g一边融合模型就会用到Bagging或AdaBoost。①在biending中如果是用平均组合的话可以用平均投票的方式,如果每个g所占的权重不同的时候就可以用线性模型组合这些g(此时这些g可以当做是原始资料的一种特征转换)。如果我们的投票活动与具体的情况有关...

2018-03-31 22:16:18 670

原创 Java常用类

运行Java程序的参数main函数的方法签名,public static void main(String[] args){...}。①public 因为它的调用者是虚拟机,所以要暴露出来。②static因为JVM在调用这个方法时不会先去创建一个对象然后再去调用。③void将一个值返回给JVM没有任何意义,JVM已经不会对返回值进行处理。④谁调用函数谁就给这个函数的参数赋值。上...

2018-03-29 22:24:33 352

原创 台大林轩田机器学习技法神经网络深度学习完全解读

笔者能力有限欢迎大家批评 : -)机器学习之神经网络机器学习之深度学习机器学习之RBFNetwork机器学习之矩阵分解

2018-03-25 17:17:46 1053

原创 机器学习之矩阵分解(机器学习技法)

特征编码二进制向量编码现实生活中有很多的多类别问题,比如说星座、血型、科目等等。机器学习中要处理这些多类别问题就会用到像决策树和随机森林这样的模型。但是这样多类别问题的模型实在太稀缺如果我们想要让其它数值模型也能够解决这些问题的话就需要将这些多元的类别编码将类别特征转换成数值特征。比如将血型编码如下图所示:用线性网络萃取特征现在有一个电影的推荐系统,我们现在有的数据就是每一个用户对每一部电影的评分...

2018-03-25 17:12:00 4236

原创 机器学习之RBFNetwork(机器学习技法)

Radial Basis Function Network 什么是Radial Basis Function放射:说明我们的计算只与我们资料点x之间的距离有关。基本函数:我们要将放射计算的模型进行线性组合。如果把整个模型组合的过程想象成一种投票。实务上我们首先计算放射函数模型,根据资料点与中心的距离决定它应该拿到多少票。然后再乘上它要投的是同意或者反对的票。最后得到一个与距离相关的函数模型。得到函...

2018-03-24 22:36:09 6711

原创 图解动态代理内核

现在有一个要求:不改变一个方法中的代码,如何在这个方法执行前后添加一些操作。静态代理继承代理我们可以使用继承的方式如下图所示:在简单的环境下继承完全可以胜任这个要求,但是随着操作的要就不断增多就会出现无限继承的场景。(当然我们这里不考虑在类中直接填写代码的情景我们的要求都封装在不同的方法中)还有一点比较致命的就是我们如果想要更改变子类中操作的顺序,继承无法满足这样的灵活性。比如我们要更换上图中后两...

2018-03-22 22:14:46 445

原创 浅谈Java垃圾回收机制

对象在内存中的状态对象在内存中一共有三种状态:①可达态:在对象创建之后若有一个以上的引用变量引用它就是可达态。程序可以通过引用变量去引用它。②可恢复态:当对象完全失去引用的时候就进入可恢复态。在这种状态下系统的垃圾回收机制就准备回收该对象使用的内存。在回收内存时系统会调用可恢复对象的finalize()方法进行资源的清理。实务上finalize()方法既可以将可恢复对象变成可达态状态又可以将它变成...

2018-03-22 12:53:08 194

原创 浅谈Java枚举类

什么是枚举类有时候一个类的对象有且固定的,这样的类就是枚举类。比如说四季,或者是九大行星。这个类突出的特点就是固定。几个特点①枚举类默认继承java.lang.Enum类而非Object这个类。②使用enum修饰,抽象的枚举类会有隐式的abstract修饰,非抽象的枚举类默认使用final修饰所以不能派生子类。(而他的枚举值是他的匿名内部子类)③构造器默认使用private来修饰。④枚举值必须在第...

2018-03-20 21:58:09 322

原创 机器学习之深度学习(机器学习技法)

深层神经网络先说说神经网络神经网络是由一个个的神经元所构成,其中每个神经元的内部都封装着一个线性或者是非线性的模型。每一个节点都会对应一个权重向量W。这个向量会与前面的输入所组合(透过tanh函数)组合后的输出又当做是新一轮的输入。我们希望模型的预测与我们的标签一样,那么我们最终的权重的大小就应该和物体的特点所一致这就是权重的意义。同时也说明了我们中间的隐藏层的转换就是我们对资料特征的萃取。最后我...

2018-03-18 21:21:32 1190

原创 机器学习之神经网络(机器学习技法)

神经网络的动机感知器的线性融合前面我们知道了将简单的模型进行融合之后会得到一个非常强大的模型。我们试着将感知器(简单的二元分类模型)做线性融合之后得到下图:其中每一个节点都是一个感知器,其第一层的感知器都是由前一层X向量与W权重的线性组合,而第二层的感知器又是由前一层的得到的小的感知器g与新一轮的权重α线性组合而成。最后得到的线性模型如上图右所示。用融合模型做逻辑运算我们试着用上面的融合模型去解决...

2018-03-17 21:57:44 14044 1

原创 Java内部类浅谈

什么是内部类把一个类放在另一个类的内部叫做内部类。内部类的作用①提供了更好的封装,把内部类隐藏在外部类之内部不允许其他类访问。比如说定义一个类为牛,它的一个内部类是牛腿。牛腿类不能够让其他的类访问,也就是一旦牛腿类离开牛的话就会毫无意义。②适合于创建那些需要一次性使用的类。比如说在添加事件响应的类中。内部类对象的核心用内部类创建的对象叫做内部类对象,内部类中能够调用外部类中的一些方法与属性究其原因...

2018-03-15 22:25:06 139

原创 设计模式之责任链模式

一个过滤敏感字眼的小故事有这样一个场景:现在我们要将“:- , 敏感词汇”经过一个过滤器之后变成“^v^,不敏感词汇”我们该怎样去写这段代码。简单替换我们可能会首先会想到这样的一段代码如下:package simplefilter;public class Main { public static void main(String[] args) { String str = ":-,敏...

2018-03-14 22:41:46 209

原创 机器学习之Blending与Bagging(机器学习技法)

一个融合的故事今天我的朋友向我荐股(这只股涨还是跌)我该怎么办,有以下的4种解决方法:①我只接受我最信任的朋友的意见(Validation模型检验)。②我让我的朋友们去投票然后选择票数最高的那一股。③我让我的朋友们去投票但是每个人投票的权重不同。④结合预测的情况去找不同的人,比如说科技股的叫A...传统股的叫B...这样我们就把这些人的意见(能够做的事情)就融合起来了。一些数学上的表示 ①用val...

2018-03-13 22:37:01 1476

原创 机器学习之Adaboost(机器学习技法)

逐步增强法(AdaptiveBoosting)引例逐步增强法的主要思想就是拿着一堆很弱的模型可以合成一个非常强大的模型(这一点与Bagging十分相似)。一个案例对算法的直观描述在课堂上老师让小孩去辨识图中那些是苹果,由于小孩的思维比较简便所以他们一次只能够学到一条规则: 一号同学说苹果是圆的所以他在一些图片的辨识上回犯错如下,所有的错误都放大显示所有的正确的都相对缩小: 这时我们的做法就是将一号...

2018-03-11 20:45:07 2608

原创 设计模式之面向对象

在进行面向对象设计程序的时候我们一般要考虑到以下的几种面向对象的思想,这样我们才能够享受面向对象编程给我们带来的快乐: - ) 考虑类主要是一些名词,在面向对象的编程里我们首相就要观察我们的问题域中有多少东西能够抽象成对象。属性在命名时要与开发的具体环境所联系。方法就能够体现类之间的关系隐藏(封装)在计算机相关的工程学中最大的特点就是结构上的重复性,在一个程序里代码的共用是非常普遍的现象。而在面向...

2018-03-06 21:46:54 446

Spark商业实战三部曲源码

Spark商业实战三部曲源码,包含书中所用到的代码以及用到的数据集

2019-03-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除