自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 【并行化——机器学习算法常见的并行实现方式】

前言在看了一些大神的面经之后觉得第二遍读基础的话想一边实现一下代码,一边关注一下算法的优化和并行化实现,毕竟工业上还是和学术上有很大区别,了解到现在常用的有mapreduce | spark | mpi | ps | hive 这些里面当年用过mapreduce和hive,始终对原理一知半解,借此机会先掌握下基本知识吧。自己也尝试搭建一下^^ 还要多看mllib源码!嗯!有点儿遗憾,这部分内容被新的

2017-10-20 10:19:24 3125

原创 data augmentation

一般比较有效的有random crop, random mirror, random resize (scale augmentation)。以上三种实现简单而且有效,基本能复现resnet的结果。至于color augmentation, random rotation, aspect ratio augmentation感觉效果几乎没有,尤其是color augmentation,貌似还有一点点

2017-07-24 14:27:39 5545

原创 pandas使用的一些技巧

偶然学到了一些技巧,不知道写在哪儿,就记在这吧,持续更新ing…逐行遍历怎么快loc是最慢的。尽量用ix代替。pandas 存在 df.iterrows() 的generator 来循环DataFrame 的 row, 这样的效率是最高的。文档丢在这:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iter

2017-07-14 16:29:47 961

原创 python数据挖掘常用的几种大数据存储格式

一直想找个机会好好学习下这块的知识,但是毕竟实践出真知,下面的就按照我自己使用过的一点点补充吧^^

2017-07-14 16:20:56 4168 1

原创 cv小白慢慢爬行

cv小白慢慢爬行2分类vs多分类sigmoid和softmax是神经网络输出层使用的激活函数,分别用于两类判别和多类判别。 binary cross-entropy和categorical cross-entropy是相对应的损失函数。 对应的激活函数和损失函数相匹配,可以使得error propagation的时候,每个输出神经元的“误差”(损失函数对输入的导数)恰等于其输出与ground t

2017-07-04 22:50:27 294

原创 Google DQN tensorflow框架实现 源码解读《二》

这段时间把源码读的差不多了,总结了这样的一个文档,希望对其他人也能有所帮助。是从我用visio做的图中截得屏,有些杂乱,如果耐心看下去会有很大帮助

2016-12-13 10:50:17 1801 2

转载 java PriorityQueue 最全讲解

PriorityQueue原文地址:https://github.com/CarpenterLee/JCFInternals/blob/master/markdown/8-PriorityQueue.md感觉这篇文章真的介绍的很直接易懂,收藏用!总体介绍前面以Java ArrayDeque为例讲解了Stack和Queue,其实还有一种特殊的队列叫做PriorityQue

2016-11-10 16:56:41 421

原创 google DQN tensorFlow框架实现 源码解读《一》tensorFlow基础学习

源码:https://github.com/devsisters/DQN-tensorflow使用 TensorFlow, 你必须明白 TensorFlow:使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch

2016-11-01 14:06:28 3476

原创 google DQN tensorFlow框架实现 源码解读《一》tensorFlow基础学习

源码:https://github.com/devsisters/DQN-tensorflow使用 TensorFlow, 你必须明白 TensorFlow:使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch

2016-11-01 11:21:27 659

原创 Effective Java 学习笔记《二》 构建器

遇到多个构造器参数时可以使用构建器这一节一看就是我需要的,以前在cl工作时常常以后构造器要写20多个参数,好在IDE好用,不然调用构造器时参数真要一个一个对,很麻烦。当然,除了写所谓的“重叠构造器”之外,可以用javaBeans模式,写一个无参构造器搭配所有的set方法。但是这个模式据书上所说有很大的缺点:构造过程被分到到了几个调用中,在构造过程中JavaBean可能处于不一致的状态,若试图使用处于

2016-10-28 17:36:12 299

转载 Java Collection

一篇解释的很清楚的博文,原文:http://skyuck.iteye.com/blog/526358稍作改动。在 Java2中,有一套设计优良的接口和类组成了Java集合框架Collection,使程序员操作成批的数据或对象元素极为方便。这些接口和类有很多对抽象数据类型操作的API,而这是我们常用的且在数据结构中熟知的。例如Map,Set,List等。并且Java用面向对象的设计对这些数据

2016-10-28 16:33:06 231

原创 Effective Java 学习笔记《一》 静态工厂方法

Effective Java 学习笔记《一》 静态工厂方法感觉之前从来没有听说过静态工厂方法,书上夸它各种好,不明觉厉,就找了些资料学习一下。 参考了书和http://www.xuebuyuan.com/1913991.html静态工厂方法是做什么的利用new语句调用类的构造方法可以实例化一个对象,但是每new一次都会占用java虚拟机中堆的内存。静态工厂方法是实例化的另一种方式,有自己的一些优点

2016-10-27 23:02:29 380

原创 基本类型/引用类型的参数传递

java对于引用类型的参数传递一样采用的是值传递的方式,但是由于复制的是地址,所以导致操作的是同一个存在于堆内存中的变量,所以会导致方法中调用的方法引起了值的改变,这一点不同于基本类型的参数传递。

2016-05-10 17:52:19 321

原创 多线程

并发行和并行性是两个概念:并行指在同一时刻多条指令在多个处理器上同时执行。并行性指同一时刻只有一条指令执行,但多个进程指令被快速轮换执行,使得宏观上具有多个进程同时执行的效果。线程和进程:线程是进程的组成部分。线程是独立运行的,抢占式的。可以与其他线程共享父进程的共享变量及部分环境。线程的创建和启动:方法一:继承Thread类创建线程类 public class ** exte

2016-05-10 14:29:34 675

转载 HIBERNATE的缓存机制

Hibernate缓存的作用: Hibernate是一个持久层框架,经常访问物理数据库,为了降低应用程序对物理数据源访问的频次,从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制,应用程序在运行时从缓存读写数据,在特定的时刻或事件会同步缓存和物理数据源的数据Hibernate缓存分类: Hibernate缓存包括两大类:Hibernate一级缓存和Hibernate

2016-05-09 11:43:23 290

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除