自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 数据预处理

常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-sco

2016-02-03 14:12:49 7577 3

原创 朴素贝叶斯理论推导与三种常见模型

朴素贝叶斯(Naive Bayes)是一种简单的分类算法,它的经典应用案例为人所熟知:文本分类(如垃圾邮件过滤)。很多教材都从这些案例出发,本文就不重复这些内容了,而把重点放在理论推导(其实很浅显,别被“理论”吓到),三种常用模型及其编码实现(Python)。如果你对理论推导过程不感兴趣,可以直接...

2015-09-09 21:41:03 53599 24

原创 KMeans聚类算法思想与可视化

1.聚类分析1.0 概念聚类分析简称聚类(clustering),是一个把数据集划分成子集的过程,每一个子集是一个簇(cluster),使得簇中的样本彼此相似,但与其他簇中的样本不相似。聚类分析不需要事先知道样本的类别,甚至不用知道类别个数,因此它是一种无监督的学习算法,一般用于数据探索,比如群组...

2015-08-20 18:52:00 36225 6

原创 流形学习-高维数据的降维与可视化

1.流形学习的概念流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样...

2015-05-22 19:55:12 33343 2

原创 SQL

终于有时间继续玩阿里的数据挖掘比赛,第二赛季限定工具,不得不先重拾一下数据库。以下笔记总结自网络教程。SQL简介 SQL指结构化查询语言 SQL是一种ANSI的标准计算机语言,存在不同的版本,但不同版本都支持一些共同的关键词。 SQL 语法 一个数据库通常包含一个或多个表。 SQL 对大小写不敏感...

2015-05-18 22:53:08 4562 0

原创 DeepLearning tutorial(7)深度学习框架Keras的使用-进阶

上一篇文章总结了Keras的基本使用方法,相信用过的同学都会觉得不可思议,太简洁了。十多天前,我在github上发现这个框架的时候,关注Keras的人还比较少,这两天无论是github还是微薄,都看到越来越多的人关注和使用Keras。所以这篇文章就简单地再介绍一下Keras的使用,方便各位入门。主...

2015-05-08 16:01:40 23839 34

原创 DeepLearning tutorial(6)易用的深度学习框架Keras简介

之前我一直在使用Theano,前面五篇Deeplearning相关的文章也是学习Theano的一些笔记,当时已经觉得Theano用起来略显麻烦,有时想实现一个新的结构,就要花很多时间去编程,所以想过将代码模块化,方便重复使用,但因为实在太忙没有时间去做。最近发现了一个叫做Keras的框架,跟我的想...

2015-04-30 17:03:10 61555 78

原创 libsvm和liblinear的使用总结

0.安装方法unix系统下的安装方法:到官网下载源包(目前最新版本为libsvm-3.20、liblinear-1.96),解压后,打开终端进入makefile所在的目录,键入make即可。以下为一些基本的使用命令,ubuntu系统下。1.生成符合要求的数据格式,以图像数据为例 从图像库得到csv...

2015-04-22 23:50:06 5699 1

原创 2015阿里天池大数据竞赛-Solution

竞赛介绍:链接这篇文章记录2015阿里天池大数据竞赛中,我的一些代码,由于目前还在比赛中,仅分享一个naive solution,基于规则,代码主页在我的github上:链接,下面是代码说明。有兴趣的请看代码注释,恕不详述。 本repo目录说明 data 存放数据 preprocess 数...

2015-04-14 00:02:06 17376 5

原创 Kaggle比赛-Otto Group Product Classification-打败一半参赛队伍的简单解法

简介Otto Group Product Classification Challenge是Kaggle上目前正在进行的一个比赛,目前已1000+队伍参赛,由Otto公司赞助1W美刀,数据也是来自于该公司的产品,提供了train.csv、test.csv、samplesubmission.csv三...

2015-03-24 23:02:45 6140 2

原创 《Python核心编程》数字类型

1、数字类型简介 Python中数字类型包括:整型、长整型、布尔型、双精度浮点型、十进制浮点型、复数。这些数字类型都是不可变类型,也就是说,改变了数字的值会生成新的对象。 在Python中删除数字对象,可以用语句:del aInt,aLong,aFloat,aComplex 2、整型 布尔型取值范...

2015-03-16 00:58:04 3152 0

原创 机器学习算法中如何选取超参数:学习速率、正则项系数、minibatch size

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习算法中,如何选取初始的超参数的值。(本文会不断补充)学习速率(learning rate,η)运用梯度下降算法进行优化时,权重的更新规则中,在梯度项前会乘以一个系数,这个系数就叫学习速率η...

2015-03-14 23:49:23 53911 7

原创 正则化方法:L1和L2 regularization、数据集扩增、dropout

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习/深度学习算法中常用的正则化方法。(本文会不断补充)正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合)。其直...

2015-03-14 18:12:20 104324 37

原创 交叉熵代价函数

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲machine learning算法中用得很多的交叉熵代价函数。1.从方差代价函数说起代价函数经常用方差代价函数(即采用均方误差MSE),比如对于一个神经元(单输入单输出,sigmoid函数),定...

2015-03-13 13:18:56 144248 18

原创 《Neural networks and deep learning》概览

最近阅读了《Neural networks and deep learning》这本书(online book,还没出版),算是读得比较仔细,前面几章涉及的内容比较简单,我着重看了第三章《Improving the way neural networks learn》,涉及深度神经网络优化和训练的...

2015-03-12 12:34:05 25088 5

原创 OpenCV人脸检测(C++代码)

OpenCV人脸检测(C++代码)—— By wepon这篇文章简单总结一下人脸检测的代码实现,基于OpenCV,C++版本。之所以强调C++版本是因为OpenCV有很多其他语言的接口,之前我也写过人脸检测的Python实现《Python-OpenCV人脸检测(代码)》,这篇文章则讲C++实现,其...

2015-03-05 14:24:05 16788 2

原创 《Python核心编程》笔记 Python对象

第4章 Python对象1、Python对象Python使用对象模型来存储数据,构造任何类型的值都是一个对象。所有的对象都有三个特性: 身份,可通过内建函数id()查看,这个值即该对象的内存地址。 类型,可通过内建函数type()查看。 值,对象表示的数据项。>>> p = 12...

2015-03-04 01:14:44 2242 0

转载 图像语义分析--深度学习方法

本文 转自:语义分析的一些方法(三),主要论述了基于深度学习方法的图像语义分析,包括图片分类、图片搜索、图片标注(image2text、image2sentence),以及训练深度神经网络的一些tricks,最后还简要地提及语义分析方法在腾讯广点通上的实际应用。 文中没有复杂的公式、原理,但总结...

2015-02-27 19:40:30 26427 5

原创 卷积神经网络的一些细节

节选自语义分析的一些方法(二),以后会不断补充。——by wepon 结合文献『Deep Learning for Computer Vision』, 以下讲讲卷积神经网络的一些注意点和问题。 激励函数,要选择非线性函数,譬如tang,sigmoid,rectified liner。在...

2015-02-27 19:35:11 5471 0

原创 《Python核心编程》笔记 基础

春节终于over了,回归充实的学习研究生活。打开久违的CSDN博客,看到官方推送的 『博客Markdown编辑器上线啦』,让我顿时有了写作的欲望,真是程序员的福利。之前阅读各种文章书籍,都是用MarkDownPad做的笔记,喜欢以及习惯于MarkDown简洁的语法。总之各种方便。为了试试效果,将以...

2015-02-27 11:22:18 2456 0

原创 《Python核心编程 》笔记-快速入门

春节终于over了,回归充实的学习研究生活。打开久违的CSDN博客,看到官方推送的 『博客Markdown编辑器上线啦』,让我顿时有了写作的欲望,真是程序员的福利。之前阅读各种文章书籍,都是用MarkDownPad做的笔记,喜欢以及习惯于MarkDown简洁的语法。总之各种方便。为了试试效果,将以...

2015-02-27 11:17:23 2379 0

原创 Python-OpenCV人脸检测(代码)

做人脸识别,首先要检测出图片/视频中的人脸,今天就研究了一下OpenCV的Python接口,把常用的一些功能模块写成函数。基于Python-OpenCV以及PIL,实现图片中人脸的检测以及截取保存、眼睛检测、笑脸检测。下面简单总结一下。........总之,利用opencv里训练好的haar特征的...

2015-02-05 09:04:20 46753 2

原创 DeepLearning tutorial(5)CNN卷积神经网络应用于人脸识别(详细流程+代码实现)

本文主要讲解将CNN应用于人脸识别的流程,程序基于python+numpy+theano+PIL开发,采用类似LeNet5的CNN模型,应用于olivettifaces人脸数据库,实现人脸识别的功能,模型的误差降到了5%以下。本程序只是个人学习过程的一个toy implement,模型可能存在ov...

2015-01-29 20:35:43 91660 91

原创 利用Python PIL、cPickle读取和保存图像数据库

利用Python PIL、cPickle读取和保存图像数据库  @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/43226127 计算机视觉、机器学习任务中,经常跟图像打交道,在C++...

2015-01-28 09:40:54 26163 11

原创 DeepLearning tutorial(4)CNN卷积神经网络原理简介+代码详解

DeepLearning tutorial(4)CNN卷积神经网络原理简介+代码详解 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/43225445 本文介绍多层感知机算法,特别是详细解...

2015-01-28 07:48:28 80144 25

原创 DeepLearning tutorial(3)MLP多层感知机原理简介+代码详解

DeepLearning tutorial(3)MLP多层感知机原理简介+代码详解 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/43221829 本文介绍多层感知机算法,特别是详细解读其代码实现,基于...

2015-01-28 03:18:22 45384 10

原创 DeepLearning tutorial(2)机器学习算法在训练过程中保存参数

DeepLearning tutorial(2)机器学习算法在训练过程中保存参数 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/43169019 参考:pickle — Python...

2015-01-26 23:45:09 11308 7

原创 DeepLearning tutorial(1)Softmax回归原理简介+代码详解

DeepLearning tutorial(1)Softmax回归原理简介+代码详解 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/43157801 本文介绍Softmax回归算法,...

2015-01-26 20:06:44 32769 5

原创 【NumPy基础】100道numpy练习——进阶篇

选自numpy-100,当作熟悉NumPy的练习。NumPy只是一个数值计算的工具包,在实际的算法实现中来熟悉NumPy才是有效的,因此后面不打算继续写了,到此文为止,基本的语

2015-01-18 22:56:53 9978 0

原创 【NumPy基础】100道numpy练习——Apprentice篇

【NumPy基础】100道numpy练习——Apprentice篇 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42811297 今天又用半小时扫了一下Apprentice篇里的10道ex...

2015-01-17 21:37:48 9746 1

原创 【NumPy基础】100道numpy练习——初学与入门篇

100道numpy练习 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42784403 今天在deeplearning.net上看theano tutorial,发现一个numpy-100-exerci...

2015-01-16 21:39:21 17755 5

原创 【DeepLearning工具】Fedora下安装theano

【DeepLearning工具】Fedora下安装Theano author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42651233 1、Theano简介 Theano是深度学习的一个python...

2015-01-12 21:53:27 4312 0

转载 2014年人工智能领域的突破

2014 in Computing: Breakthroughs in Artificial Intelligence 原文:http://www.technologyreview.com/news/533686/2014-in-computing-breakthroughs-in-arti...

2014-12-30 14:30:05 2295 0

原创 【简化数据】奇异值分解(SVD)

【简化数据】奇异值分解(SVD) @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42214205 1、简介 奇异值分解(singular Value Decomposition),简称SV...

2014-12-28 15:28:00 32786 3

原创 相似度计算

相似度计算 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42213883 《Machine Learning in Action》笔记,相似度计算,基于python+numpy。 ...

2014-12-28 14:52:40 13603 1

原创 scikit-learn中PCA的使用方法

scikit-learn中PCA的使用方法 @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42192293 在前一篇文章 主成分分析(PCA) 中,我基于python和numpy实现了PCA算法,主...

2014-12-27 13:08:39 124480 14

原创 【机器学习算法实现】主成分分析(PCA)——基于python+numpy

【机器学习算法实现】主成分分析(PCA)——基于python+numpy @author:wepon @blog:http://blog.csdn.net/u012162613/article/details/42177327 1、PCA算法介绍 主成分分析(Principal...

2014-12-26 21:16:51 72315 25

原创 【leetcode 哈希表】Majority Element

leetcode新題,Majority Element ,难度easy。题意:给定一个长度为n的数组,找出majority element,所谓majority element就是出现次数大于n/2的那个数。 很简单的题目,解法很多: Runtime: O(n2) — Brute force so...

2014-12-22 15:31:08 4494 0

转载 机器学习(Machine Learning)&深度学习(Deep Learning)资料

机器学习(Machine Learning)&深度学习(Deep Learning)资料 機器學習、深度學習方面不錯的資料,轉載。 原作:https://github.com/ty4z2008/Qix/blob/master/dl.md 原作作者會不斷更新,本文更新至20...

2014-12-21 13:26:16 7122 1

原创 【leetcode 进制转换】Excel Sheet Column Title

leetcode新題,Excel Sheet Column Title,本質是進制轉化,難度easy。excel中的序是这样排的:A~Z,AA~ZZ,AAA~ZZZ....... 本质是进制转换,将n转化为26进制,转化过程如下(括号里的是26进制数): 1->(1)->A 2->...

2014-12-21 12:30:13 15143 3

提示
确定要删除当前文章?
取消 删除