自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lotuswhl的博客

路漫漫其修远兮,吾将上下而求索

  • 博客(24)
  • 收藏
  • 关注

原创 随笔系列之 一致性哈希(consistent hash)

简单说说一致性hash关于hash 首先,什么是hash以及为什么要用hash?简单带过: hash本身就是将目标对象或者数据片段映射到另外一个数据片段中.在编程环境下,通常意味着将一个数据或数值数据或字符串数据等等,映射为一个整型数值. 那么为何要用hash?很简单的一个原因:为了速度!为了方便!当然,这里指的是日常编程需要对hash的用法.除了方面访问数据,hash还有别的...

2018-05-04 17:52:55 244

原创 随笔系列之 交叉熵(cross entropy) and KL divergence

有关交叉熵Cross Entropy 与KL 散度的一点点cross entropy我相信了解过机器学习的基本算法的人没有不知道交叉熵这个东西的;通常,我们在机器学习的模型训练中会使用交叉熵作为我们损失函数 log loss. 但是,我们可能大概的理解,只要这个交叉熵损失函数越小,我们的模型就会越准确,似乎是意见很神奇的事情;如果理解的多一点的可能会从其表达式来理解,比如:二分类问题的交叉...

2018-05-03 22:26:26 1538

原创 随笔系列之- 数据的类型(Categorical(Nominal),Ordinal,Internal)

几个数据类型:Categorical Type,Ordinal Type,Interval Type介绍在机器学习或者数据处理的任务中,我们遇到的数据类型往往是多种多样的,对于不同的数据类型,我们的处理方式/分析方法会有所不同,因此了解不同的数据类型是有必要的.下面简单的介绍一下这几种数据类型,也便于自己以后参考,不足之处,日后修正.Categorical Type 什么是ca...

2018-04-03 00:24:39 10854

原创 随笔系列之- ROC And AUC

关于ROC与AUC的一点点介绍ROC Receiver Operating CharacteristicsROC是一种曲线用于描述二分类判别器对不同的threshold的曲线;用于表达判别器的分类能力; 其主要有两个指标:TPR和FPR,根据这两个值(不同的threshold有不同的值)来绘制曲线;TPR : True Positive Rate TPR=TPTP+FNTPR=...

2018-04-02 21:33:20 345

原创 随笔系列之- log loss

log loss在机器学习构建分类模型的任务中经常使用的损失度量方法; 对数损失的公式为: −∑iN∑jMyijlog(pij)−∑iN∑jMyijlog(pij)-\sum_i^N\sum_j^My_{ij}log(p_{ij}) 其中N对应于我们的样本数或者输入的实例的数量,i对应于某一个样本或者实例;M表示我们的样本可能的分类数量,j表示某一个分类;yijyijy_{ij} 表示对...

2018-04-01 21:41:55 5328

翻译 C/C++ Undefined Behaviour (UB)

C++/C 程序未定义行为 实例除零int main(){ int x = 25, y = 0; int z = x / y; printf("Hello World!"); return 0;}变量未初始化int main(){ bool val; if (val) printf("TRUE")...

2018-03-19 15:50:56 3455

翻译 C++不会编译通过的C程序 示例

虽然C++一直保持着与C兼容,但是依旧有些不同的地方!需要注意纯C程序的问题!在C++当中,函数未声明先使用会出现编译错误,但是C编译器或许会通过#include<stdio.h>int main(){ foo(); // foo() is called before its declaration/definition} int foo(){ ...

2018-03-19 11:34:45 401

原创 白话系列之 bias and variance

机器学习中的bias和variance简单理解bias 和variance的概念理解一点点背景 在常见的机器学习问题中,我们往往希望根据已有的数据,使用机器学习的模型和算法去学习已知数据的信息;我们的最终目标是希望我们可以学习到原始数据的真实分布,真实模型,因为只有这样我们才可以使用学习到模型去做我们想做的事,比如预测,判别等等。既然要学习到数据的真实分布,又不得不提机器学习...

2018-03-15 16:13:17 259

原创 深度学习-学习笔记

深度学习-学习笔记背景知识人工智能深度学习人工智能的知识库机器学习逻辑回归朴素贝叶斯数据的表示表示学习 使用机器学习来发掘表示本身! 表示学习算法在短时间内就可以发现一个很好的特征集 表示学习的经典例子:自编码器 变差因素 能够解释观察数据的因素(这些因素通常是不能被直接观察到的量) 他们可以看做数据的概念或者抽象,帮助我们...

2018-03-13 14:15:46 654

原创 C++11模板元编程

模板元编程 模板元编程只能处理在编译期的常量,不能处理运行期的变量。其所使用的语法也很受限,不能使用ifelse等语句,因此模板元编程需要很多的技巧,需要使用类型定义,枚举常量,集成,模板偏特化等来配合。不能使用C++运行时的关键字(ifelse,for等)常用的是:enum ,static const ,用来定义编译期整数typedef/using 用于定义元数...

2018-03-13 14:11:12 1144

原创 C++Primer部分笔记

C++ 部分要点知识整理基本知识一点点 函数的返回类型不能是数组 const int * 与const int[],const int[10]作为形参等价 int (*metrix)[10] 与 int metrix[][10]形参声明,等价 initializer_list形参;可变形参 函数不可返回局部对象的引用或者指针,否则可能会导致严重的错误(生命周期...

2018-03-13 14:10:07 176

原创 deep residual net introduction

深度残差网络简介背景 随着深度卷积神经网络的广泛引用,其强大的特征提取能力,使得我们可以使用end-to-end的方式进行网络训练,使得卷积网络本身可以学习到需要的特征,解决我们的目标问题:如图像分类。 但是由于我们使用的是基于梯度下降的backpropagation优化方法,随着网络深度的增加,不得不处理随之而来的梯度vanish、exploding等问题,这给深度网络的训练...

2018-03-12 23:17:59 181

原创 support vector machines

支持向量机支持向量机最简单的理解: 支持向量机可以用于对数据进行分类也可以用于回归。其本质是要在两类数据特征向量之间寻找一个分隔超平面,用于将两类样本分离。其主要特征在于,要寻找的超平面是可以将两类数据特征向量到超平面的距离最远;也就是不仅仅要找到一条超平面用于分隔两类数据,而且还要使得边界距离最大化。在支持向量机中还有两个概念:函数距离:也就是样本点到超平面的距离...

2018-03-12 19:23:37 1366

原创 questions upon machine learning

what is the difference between LR and SVMlogistic regression 似乎在实用一个连续的函数匹配数据并不总是单分类问题,所以LR可能会存在对P=0.5的情况难以分类SVM则试图使用一个超平面去将一组多维数据分割成两类SVM对于非线性可分的数据难以分类,或者如果两类数据之间的间隔不足,也会导致SVM难以分类。How are ...

2018-03-12 19:22:35 128

翻译 how to choose a machine learning classifier

如何选择一个机器学习分类器你是如何为你的分类问题选择机器学习算法的呢?当然,如果你很关注accuracy,那么最佳方案便是测试一组不同的算法(当然,相应的也要确保对每个算法进行不同参数的尝试),然后通过交叉验证选择其中最好的一个算法。但是,如果你只是想找一个“足够好”的算法,或者寻起初步方案,那么这里有一些不错的通用的方案可供借鉴。你的训练数据集有多大?如果你的数据集比较小,那么h...

2018-03-12 19:20:58 384

原创 deep learning AI book -chapter05 machine learning basics --notes

Deep learning book chapter05 – notes5.6 Bayesian Statistics 频率派认为θ的真实值是确定而未知的:他们的方法是基于对一个单一变量θ的点估计而后续的工作都是基于那个单一的估计进行的。 而贝叶斯派则将θ的所有可能取值考虑在内,然后做预测。(他们认为θ数据集本身是可以直接观察的,所以并不是随机的,而相对的,参数值的真实值却是未知

2017-09-28 10:39:06 216

转载 ubuntu 16.04 安装 tensorflow-gpu 包括 CUDA ,CUDNN,CONDA

ubuntu 16.04 安装 tensorflow-gpu 包括 CUDA ,CUDNN,CONDA显卡驱动装好了,如图:英文原文链接:https://github.com/williamFalcon/tensorflow-gpu-install-ubuntu-16.04英文内容: Tensorflow GPU install on ubuntu 16.04update apt-getsudo

2017-09-24 14:28:07 543

原创 C++实现快速排序,归并排序,堆排序

回忆几个重要的排序算法,留存: #include <iostream>*归并排序using namespace std;/* 归并排序 @dragonboss*/int buff1[10] = {0};int buff2[10] = {0};void Merge(int arr[],int s1,int len1,int s2,int len2){ //拷贝数据缓

2016-08-16 19:54:47 577

原创 Scala面向对象学习

Scala的get set方法的相关问题:在Scala中设置get方法如下:def name = this.myname 方法的调用是:val n = obj.name(obj替换成相应的对象)那么就可以设置对应的set方法:def name_=(inputNmae:String){ this.myname=inputName} 方法的调用就是:obj.name=n(这样就可以完成s

2016-07-25 09:10:06 198

原创 openssl使用自定义CA签名证书

使用Openssl生成CA证书并使用CA证书对自己网站的证书自签名的过程以下是我在查询相关数据资料时根据自己的实践的成功案例。网上的问题很多,这里留存一份自己成功的案例备用。1、下载带有openSSL的apache安装包,我下载的为apache_2.2.11-win32-x86-openssl-0.9.8i.msi,安装后确认一下bin路径下的openssl.exe,ssleay32.dll和lib

2016-07-24 09:25:55 1817

原创 windows下使用openssl建立自签名证书的过程

windows下使用openssl建立自签名证书的过程:网上找了很多相关的信息,大多有问题,不能正常实现,我将自己成功的案例保存到这里,供以后使用。 1、第一步首先开启已安装openssl的apache的SSL功能。启用SSL:加载SSL模块,引入ssl配置文件。 2、第二步进入apache的bin目录下执行以下操作: 1)首先设置环境变量配置openssl.cnf的路

2016-07-24 09:14:13 1848

原创 openssl pfx cer

pfx转cer 安装好OpenSSL,然后到bin目录下,执行以下命令即可完成转换: openssl pkcs12 -nodes -nokeys -in 1.pfx -passin pass:证书密码 -out 1.cer 如无需加密pem中私钥,可以添加选项-nodes;利用私钥.key和证书.crt生成pfx文件 openssl pkcs12 -export -in cli

2016-07-24 09:10:26 376

原创 java static变量 this隐式参数

java中的静态方法不能调用普通方法静态变量不能被普通变量初始化 因为非静态的方法依赖于对象而存在。普通方法(非静态)可以调用静态方法和使用静态变量,也就是可以使用公共存储区域。this隐式参数 每个非静态方法,在编译时,编译器都会传一个隐式参数this给当前的方法,通常会传递两个隐式参数,this super 。构造器中传入的this也就等于正在初始化的对象。可以通过this()调用其

2016-07-24 08:48:17 358

原创 堆区和栈区的概念

堆和栈的概念栈区(stack自动分配的连续空间) 由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。堆区(heap不连续的空间) 一般由程序员分配释放,如果程序员不释放,程序结束时由OS回收,需要注意的是这与数据结构中的堆是两回事,分配的方式类似于链表。java中的堆区存放new出来的对象。java中的方法区(类似于堆) 用于存放类的信息,比如类

2016-07-24 08:33:18 590

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除