自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 C++11新宠-Lambda函数学习

Lambda背景Lambda来自lambda calculus(λ演算,如果有兴趣,可以看这篇文章http://cgnail.github.io/academic/lambda-1/)——一种定义和应用函数的数学系统。Lambda 表达式之所以是 C++ 11 新增特性中最激动人心的一个,究其原因是其在距离、简洁、效率和功能上都让人耳目一新。引入的主要目的是让你能够将类似于函数的表达式用作接受函

2017-12-02 18:57:38 862

原创 3-java学习笔记

多态多态是同一个行为具有多个不同表现形式或形态的能力。多态就是同一个接口,使用不同的实例而执行不同操作。优点:1 消除类型之间的耦合关系 2 可替换性 3 可扩充性 4 接口性 5 灵活性 6 简化性多态存在的三个必要条件1 继承 2 重写 3 父类引用指向子类对象 举个栗子 //父类 public class Pro { int a = 32

2017-10-22 20:11:07 490

原创 2-java学习笔记

为什么要继承: 继承是java面向对象编程技术的一块基石,因为它允许创建分等级层次的类。 继承就是子类继承父类的特征和行为,使得子类对象(实例)具有父类的实例域和方法,或子类从父类继承方法,使得子类具有父类相同的行为。 在不同的类中也可能会有共同的特征和动作,可以把这些共同的特征和动作放在一个类中,让其它类共享。 因此可以定义一个通用类,然后将其扩展为其它多个特定类,这些特定类

2017-10-22 13:42:22 440

原创 1-java学习笔记

一.package 的作用就是 c++ 的 namespace 的作用,防止名字相同的类产生冲突。Java 编译器在编译时,直接根据 package 指定的信息直接将生成的 class 文件生成到对应目录下。如 package aaa.bbb.ccc 编译器就将该 .java 文件下的各个类生成到 ./aaa/bbb/ccc/ 这个目录。 import 是为了简化使用 package 之后的实

2017-10-12 17:53:05 328

原创 2-数据类型

内置数组数据类型 在内置数据类型与标准库类的类型之间是复合类型,特别是指针和数组类型。 数组(array)是一种顺序容器,它包含单一类型的元素。 虽然C++对数组类型提供了内置支持,但是这种支持仅限于“用来读写单个元素”的机制。C++不支持数组的抽象(abstraction),也不支持对整个数组的操作。 动态内存分配和指针 在C++中,对象可以静态分配——即编译器在处理程序源

2017-09-24 19:30:46 371

原创 1-概述&程序构成基本元素

程序组成=算法+数据 从”过程化程序设计”过度到”面向对象程序设计”就不过多细述了。 面向对象的程序设计方法通过继承(inheritance)机制和动态绑定(dynamic binding)机制扩展了抽象数据类型。继承机制是对现有实现代码的重用,动态绑定是指对现有的公有接口的重用。C++程序 表达式、对象、程序流程控制、预处理指示符、注释、输入输出等等。 prog1.cpp

2017-09-24 14:09:07 599

原创 关于在线机器学习ftrl_proximal_lr的二三件事

题记:一直以为ftrl_proximal_lr模型是为了解决参数在内存中的使用问题。跟大神请教后,ta说:ftrl_proximal 为了解决online中模型稀疏性的问题。前世今生直接贴图:

2017-09-19 11:04:42 1496

原创 常用系统函数整理

substrdatetrunc

2017-09-18 11:56:27 548

原创 Keras-Sequential模型(2)

重点介绍Sequential模型方法compilecompile(self, optimizer, loss, metrics=[], sample_weight_mode=None, **kwargs) 编译用来配置模型的学习过程,其参数有:optimizer: str (name of optimizer) or optimizer object. optimizer:字符串(预定义优

2016-12-06 15:43:37 4260

原创 Keras-Sequential模型(1)

Sequential是多个网络层的线性堆叠。 看到以上关于layer(层)的概念,兴许,对于刚刚接触Keras的童鞋们来说还是比较懵逼,例如我,然后参考了其他的一些博主的成果,有种“柳暗花明”的赶脚。 Keras实现了很多层,包括core核心层,Convolution卷积层、Pooling池化层等非常丰富有趣的网络结构。而实现一个Sequential模型(相对比较特殊)则需要多个层来共同

2016-12-06 14:08:54 10023 1

转载 大数据背景下的互联网金融应用领域

以下的内容均是摘自2014BDTC【陈继东:解密蚂蚁金服基于大数据的安全和风控体系】 链接如下http://www.csdn.net/article/2014-12-05/2822961?locationNum=12&fps=1 陈继东采访问答整理如下请首先介绍一下您公司的业务,大数据对公司业务的价值,以及您部门的职责? 陈继东:蚂蚁金服以小微企业和普通消费者为主要用户,建立以数据

2016-12-06 13:37:00 2114

原创 Keras一些基本概念

符号计算 Keras的底层库使用Theano或TensorFlow,这两个库也称为Keras的后端,无论事Theano还是TensorFlow,都是一个符号主义的库。 关于符号主义,可以一般概括为这种说法:符号主义的计算首先定义各种变量,然后建立一个“计算图”,计算图规定了各个变量之间的计算关系。建立好的计算图需要编译已确定其内部细节,然而,此时的计算图还是一个“空壳子”,里面没有任何实际

2016-12-05 12:45:43 10332 1

原创 Keras快速上手

Keras的核心数据结构是“模型”,模型是一种组织网络层的方式。Keras中主要的模型是Sequential模型,Sequential是一系列网络层按顺序构成的栈。你也可以查看泛型模型来学习建立更复杂的模型 以代码和注释的结合的方式来具体了解一下如何快速使用Keras。

2016-12-03 17:20:42 4518

原创 Keras后端

遇到的问题 安装好keras后,本打算试探性写点代码,测试其是否安装成功,突然遇到如图所示的问题。然后查了Keras中文文档,才恍然大悟。我之前刚刚只装了Theano,并没有装Tensorflow。而作为Keras的“后端引擎”,默认是Tensorflow,那我们来手动改一下吧,顺便普及一些基本知识(共同学习,共同探讨)什么是“后端” Keras是一个模型级的库,提供了快速构建深度学习网络

2016-12-03 16:20:24 5791

原创 初识Keras

Keras是什么 Keras是一个高层神经网络库,Keras由纯Python编写而成,基于Theano和TensorFlow的深度学习库。Keras为支持快速实验而生,能够把你的idea迅速转换成结果,如果你有如下需求,请选择Keras: 简易而快速的原型设计(Keras具有高度模块化,极简和可扩充性)支持CNN和RNN,或二者的结合支持任意的链接方案(包括多输入和多输出训练)无缝CP

2016-12-03 15:37:14 874

原创 5-Scala对象(Class)和类(Object)

类(class)和构造器: 类的定义形式如下:class MyClass(a: Int, b: Int) { println(a.toString)} 在scala中,类也可以带有类参数,类参数可以直接在类的主体中使用,没必要定义字段然后把构造器的参数赋值到字段里,但需要注意的是:类参数仅仅是个参数而已,不是字段,如果你需要在别的地方使用,就必须定义字段。不过还有一种称为参数化

2016-11-29 10:24:01 4970

原创 4-Scala函数

函数定义 定义函数时,除了递归函数之外,可以省略返回值类型声明,scala会根据=号后边的表达式的类型推断返回值类型,同时=号后边表达式的值就是函数的返回值,无需使用return语句(scala推荐使用表达式值代替return返回值,当然根据需要,也可以显式使用return返回值)。

2016-11-23 14:13:32 472

原创 集成学习框架-学习小结20161121

1 参数可分为两种,一种是影响模型在训练集上的准确度或是影响防止过拟合能力的参数;另外一种是不影响这两者的其他参数。模型在样本总体上的准确度(后简称准确度)由其在训练集上的准确度及其防止过拟合的能力所共同决定,所以在调参时,我们主要对第一种参数进行调整,最终达到的效果是:模型在训练集上的准确度和防止过拟合能力的大和谐! 2 简单来说,集成学习是一种技术框架,其按照不同的思路来组合基础模型。目前

2016-11-21 15:40:34 1890

原创 Scikit-Learn与回归树

回归算法原理 CART(Classification and Regression Tree)算法是目前决策树算法中最为成熟的一类算法,应用范围也比较广泛。它既可以用于分类。 西方预测理论一般都是基于回归的,CART是一种通过决策树方法实现回归的算法,它具有很多其他全局回归算法不具有的特性。 在创建回归模型时,样本的取值分为观察值和输出值两种,观察值和输出值都是连续的,不像分类函数那

2016-11-18 21:04:34 7542

原创 ID3完整代码实现

决策树的基本思想 决策树的思想来源非常朴素,每个人大脑中都有类似if-then这样的判断逻辑,if表示条件,then就是选择或决策。在程序设计中,最基本的语句条件分支结构就是if-then结构。而最早的决策树就是利用这类结构分隔数据的一种分类学习方法。实例背景 假定某IT公司销售笔记本电脑产品,为了提高销售收入,公司对各类用户建立了统一的调查表,统计了几个月的销售数据之后收集了如图所示的数据

2016-11-18 17:18:04 4402 2

原创 3-Scala控制结构

Scala和其他编程语言有一个根本性差异:在scala中,几乎所有构造出来的语法结构都有值。这个特性使得程序结构更加精简。scala内建的控制结构很少,仅有if、while、for、try、match和函数调用等而已。如此之少的理由是,scala从语法层面上支持函数字面量。if表达式 scala的if/else语法结构与java等一样,但是在scala中if/else表达式有值,这个值就是跟在if

2016-11-18 11:20:50 292

原创 2-Scala语法

数据类型 Scala有7种数值类型:Byte、Char、Short、Int、Long、Float和Double,以及2种非数值类型:Boolean和Unit(只有一个值“()”,相当于java和c++中的void,即空值)。 这些类型都是抽象的final类(不能使用new新建,也不能被继承),在scala包中定义,是对java基本数据类型的包装,因此与java基本数据类型有相同的长度。同时

2016-11-18 10:06:51 289

原创 1-Scala概述

Scala是一门以java虚拟机(JVM)为目标运行环境并将面向对象和函数式编程的最佳特性结合在一起的静态类型编程语言。

2016-11-18 00:03:40 433

转载 GBDT迭代决策树的入门教程

GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generalization)较强的算法。近些年更因为被用于搜索排序的机器学习模型而引起大家关注。

2016-11-17 23:33:07 407

原创 10 mins 搞懂“倒排索引”

单词-文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图1展示了其含义。图1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。 从纵向即文档这个维度来看,每列代表文档包含了哪些单词,比如文档1包含了词汇1和词汇4,而不包含其它单词。从横向即单词这个维度来看,每行代表了哪些文档包含了某个单词。比如对于词汇1来说,文档1和文档4中出现过单词1,而其它

2016-11-17 23:12:31 495

转载 P2P风控措施和风控流程

P2P是一种跳过银行间接贷款融资模式的一种在借款人和出借人之间直接发生借贷关系的业务模式,那么理解P2P的风险是什么就很简单,就是借款人不能偿还借款的风险。

2016-11-16 21:08:28 3673

原创 BFS和DFS算法原理(通俗易懂版)

DFS 算法思想:一直往深处走,直到找到解或者走不下去为止BFS算法DFS:使用栈保存未被检测的结点,结点按照深度优先的次序被访问并依次被压入栈中,并以相反的次序出栈进行新的检测。BFS:使用队列保存未被检测的结点。结点按照宽度优先的次序被访问和进出队列。框架:BFS:#include#include#include#include

2016-11-16 17:25:32 187432 24

原创 互联网金融时代下机器学习与大数据风控系统

机器学习在互联网金融行业中的应用在企业数据的应用的场景下,人们最常用的主要是监督学习和无监督学习的模型,在金融行业中一个天然而又典型的应用就是风险控制中对借款人进行信用评估。因此互联网金融企业依托互联网获取用户的网上消费行为数据、通讯数据、信用卡数据、第三方征信数据等丰富而全面的数据,可以借助机器学习的手段搭建互联网金融企业的大数据风控系统。

2016-11-16 17:10:04 1331

原创 搜索引擎的技术架构

搜索引擎

2016-11-16 17:07:48 639

原创 线性代数的本质-20160614总结

线性代数的本质

2016-11-16 16:49:51 583

原创 广告算法所需要搞懂的基础知识

先简单解释下基本的:DSP(Demand Side Platform)是需求方平台,负责接受投放需求,找人群数据,实现投放竞价等功能的那么一个中央管理控制平台。DMP(Data Management Platform)是数据管理平台,负责数据汇集和按需要与DSP进行数据交换,下面看一个图:与以往的互联网广告投放方式不同,DSP模式的主要特征是精准定位目标人群,先按照投放需求来圈定目标受众,

2016-11-16 16:44:48 13046

原创 关于RTB实时竞价的基本原理

2016-11-16 16:38:48 4004

原创 面试机器学习、数据挖掘、大数据岗位时遇到的各种问题

平台研究类数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;算法研究类文本挖掘,如领域知识图谱构建、垃圾短信过滤等; 推荐,广告推荐、APP 推荐、题目推荐、新闻推荐等; 排序,搜索结果排序、广告排序等; 广告投放效果分析; 互联网信用评价; 图像识别、理解。数据挖掘类 商业智能,如统计报表; 用户体验分析

2016-11-16 16:19:35 4064 1

转载 CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别?

神经网络技术起源于上世纪五、六十年代,当时叫感知机(perceptron),拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。早期感知机的推动者是Rosenblatt。      但是,Rosenblatt的单层感知机有一个严重得不能再严重的问题,即它对稍复杂一些的函数都无能为力(比如最为典型的“异或”操作)。连异或都不能拟合,你还能指望这货有什么实

2016-11-16 16:05:41 1116

原创 Deep Belief Networks深信度网络

DBNs是一个概率生成模型,与传统的判别模型的神经网络相对,生成模型是建立一个观察数据和标签之间的联合分布,对P(Observation|Label)和 P(Label|Observation)都做了评估,而判别模型仅仅而已评估了后者,也就是P(Label|Observation)。对于在深度神经网络应用传统的BP算法的时候,DBNs遇到了以下问题: (1)需要为训练提供一个有标签的样本集;(2)

2016-01-22 14:03:07 4126

原创 Restricted Boltzmann Machine (RBM)限制波尔兹曼机

假设有一个二部图,每一层的节点之间没有链接,一层是可视层,即输入数据层(v),一层是隐藏层(h),如果假设所有的节点都是随机二值变量节点(只能取0或者1值),同时假设全概率分布p(v,h)满足Boltzmann 分布,我们称这个模型是Restricted BoltzmannMachine (RBM)。![这里写图片描述](http://img.blog.csdn.net/2016012213512

2016-01-22 13:52:49 798

原创 Deep Learning的基本思想以及训练过程

一 、DL的基本思想(通俗易懂)假设我们有一个系统S,它有n层(S1,…Sn),它的输入是I,输出是O,形象地表示为: I =>S1=>S2=>…..=>Sn => O,如果输出O等于输入I,即输入I经过这个系统变化之后没有任何的信息损失(呵呵,大牛说,这是不可能的。信息论中有个“信息逐层丢失”的说法(信息处理不等式),设处理a信息得到b,再对b处理得到c,那么可以证明:a和c的互信息不会超过

2016-01-22 13:48:03 750

原创 Python之快速排序算法实现(二)

相对于算法实现(一),下面这个实现过程更容易理解:#!/usr/bin/pythonclass sort: def quicksort2(self,seq,left,right): i = left; j = right; middle = seq[left]; while i<=j: while seq[i]< middle and i<right

2016-01-18 17:05:04 386

原创 Python之堆排序算法实现

#!/usr/bin/pythonimport heapq#第一种方法是根据堆排序的原理实现的。def fixdown(a,k,n):#自顶向下堆化 N =n-1; while 2*k<=N: j=2*k; if j<N and a[j]<a[j+1]: j+= 1; if a[k]<a[j]: a[k],a[j]=a[j],a[k];

2016-01-18 15:52:42 523

转载 Python之快速排序算法实现(一)

!/usr/bin/pythondef qsort(seq): if seq==[]: return []; else: pivot     = seq[0]; lesser    = qsort([x for x in seq[1:] if x

2016-01-18 15:32:51 411

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除