排序:
默认
按更新时间
按访问量

数据预处理

常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-sco

2016-02-03 14:12:49

阅读数:5271

评论数:3

朴素贝叶斯理论推导与三种常见模型

朴素贝叶斯(Naive Bayes)是一种简单的分类算法,它的经典应用案例为人所熟知:文本分类(如垃圾邮件过滤)。很多教材都从这些案例出发,本文就不重复这些内容了,而把重点放在理论推导(其实很浅显,别被“理论”吓到),三种常用模型及其编码实现(Python)。如果你对理论推导过程不感兴趣,可以直接...

2015-09-09 21:41:03

阅读数:23516

评论数:11

KMeans聚类算法思想与可视化

1.聚类分析1.0 概念聚类分析简称聚类(clustering),是一个把数据集划分成子集的过程,每一个子集是一个簇(cluster),使得簇中的样本彼此相似,但与其他簇中的样本不相似。聚类分析不需要事先知道样本的类别,甚至不用知道类别个数,因此它是一种无监督的学习算法,一般用于数据探索,比如群组...

2015-08-20 18:52:00

阅读数:15174

评论数:3

流形学习-高维数据的降维与可视化

1.流形学习的概念流形学习方法(Manifold Learning),简称流形学习,自2000年在著名的科学杂志《Science》被首次提出以来,已成为信息科学领域的研究热点。在理论和应用上,流形学习方法都具有重要的研究意义。假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样...

2015-05-22 19:55:12

阅读数:18060

评论数:2

SQL

终于有时间继续玩阿里的数据挖掘比赛,第二赛季限定工具,不得不先重拾一下数据库。以下笔记总结自网络教程。SQL简介 SQL指结构化查询语言 SQL是一种ANSI的标准计算机语言,存在不同的版本,但不同版本都支持一些共同的关键词。 SQL 语法 一个数据库通常包含一个或多个表。 SQL 对大小写不敏感...

2015-05-18 22:53:08

阅读数:3096

评论数:0

DeepLearning tutorial(7)深度学习框架Keras的使用-进阶

上一篇文章总结了Keras的基本使用方法,相信用过的同学都会觉得不可思议,太简洁了。十多天前,我在github上发现这个框架的时候,关注Keras的人还比较少,这两天无论是github还是微薄,都看到越来越多的人关注和使用Keras。所以这篇文章就简单地再介绍一下Keras的使用,方便各位入门。主...

2015-05-08 16:01:40

阅读数:20702

评论数:33

DeepLearning tutorial(6)易用的深度学习框架Keras简介

之前我一直在使用Theano,前面五篇Deeplearning相关的文章也是学习Theano的一些笔记,当时已经觉得Theano用起来略显麻烦,有时想实现一个新的结构,就要花很多时间去编程,所以想过将代码模块化,方便重复使用,但因为实在太忙没有时间去做。最近发现了一个叫做Keras的框架,跟我的想...

2015-04-30 17:03:10

阅读数:53772

评论数:78

libsvm和liblinear的使用总结

0.安装方法unix系统下的安装方法:到官网下载源包(目前最新版本为libsvm-3.20、liblinear-1.96),解压后,打开终端进入makefile所在的目录,键入make即可。以下为一些基本的使用命令,ubuntu系统下。1.生成符合要求的数据格式,以图像数据为例 从图像库得到csv...

2015-04-22 23:50:06

阅读数:4318

评论数:1

2015阿里天池大数据竞赛-Solution

竞赛介绍:链接这篇文章记录2015阿里天池大数据竞赛中,我的一些代码,由于目前还在比赛中,仅分享一个naive solution,基于规则,代码主页在我的github上:链接,下面是代码说明。有兴趣的请看代码注释,恕不详述。 本repo目录说明 data 存放数据 preprocess 数...

2015-04-14 00:02:06

阅读数:14486

评论数:5

Kaggle比赛-Otto Group Product Classification-打败一半参赛队伍的简单解法

简介Otto Group Product Classification Challenge是Kaggle上目前正在进行的一个比赛,目前已1000+队伍参赛,由Otto公司赞助1W美刀,数据也是来自于该公司的产品,提供了train.csv、test.csv、samplesubmission.csv三...

2015-03-24 23:02:45

阅读数:5064

评论数:3

《Python核心编程》数字类型

1、数字类型简介 Python中数字类型包括:整型、长整型、布尔型、双精度浮点型、十进制浮点型、复数。这些数字类型都是不可变类型,也就是说,改变了数字的值会生成新的对象。 在Python中删除数字对象,可以用语句:del aInt,aLong,aFloat,aComplex 2、整型 布尔型取值范...

2015-03-16 00:58:04

阅读数:2716

评论数:0

机器学习算法中如何选取超参数:学习速率、正则项系数、minibatch size

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习算法中,如何选取初始的超参数的值。(本文会不断补充)学习速率(learning rate,η)运用梯度下降算法进行优化时,权重的更新规则中,在梯度项前会乘以一个系数,这个系数就叫学习速率η...

2015-03-14 23:49:23

阅读数:32185

评论数:6

正则化方法:L1和L2 regularization、数据集扩增、dropout

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习/深度学习算法中常用的正则化方法。(本文会不断补充)正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合)。其直...

2015-03-14 18:12:20

阅读数:61281

评论数:24

交叉熵代价函数

本文是《Neural networks and deep learning》概览 中第三章的一部分,讲machine learning算法中用得很多的交叉熵代价函数。1.从方差代价函数说起代价函数经常用方差代价函数(即采用均方误差MSE),比如对于一个神经元(单输入单输出,sigmoid函数),定...

2015-03-13 13:18:56

阅读数:105202

评论数:18

《Neural networks and deep learning》概览

最近阅读了《Neural networks and deep learning》这本书(online book,还没出版),算是读得比较仔细,前面几章涉及的内容比较简单,我着重看了第三章《Improving the way neural networks learn》,涉及深度神经网络优化和训练的...

2015-03-12 12:34:05

阅读数:18319

评论数:4

OpenCV人脸检测(C++代码)

OpenCV人脸检测(C++代码)—— By wepon这篇文章简单总结一下人脸检测的代码实现,基于OpenCV,C++版本。之所以强调C++版本是因为OpenCV有很多其他语言的接口,之前我也写过人脸检测的Python实现《Python-OpenCV人脸检测(代码)》,这篇文章则讲C++实现,其...

2015-03-05 14:24:05

阅读数:10785

评论数:2

《Python核心编程》笔记 Python对象

第4章 Python对象1、Python对象Python使用对象模型来存储数据,构造任何类型的值都是一个对象。所有的对象都有三个特性: 身份,可通过内建函数id()查看,这个值即该对象的内存地址。 类型,可通过内建函数type()查看。 值,对象表示的数据项。>>> p = 12...

2015-03-04 01:14:44

阅读数:1921

评论数:0

图像语义分析--深度学习方法

本文 转自:语义分析的一些方法(三),主要论述了基于深度学习方法的图像语义分析,包括图片分类、图片搜索、图片标注(image2text、image2sentence),以及训练深度神经网络的一些tricks,最后还简要地提及语义分析方法在腾讯广点通上的实际应用。 文中没有复杂的公式、原理,但总结...

2015-02-27 19:40:30

阅读数:17033

评论数:4

卷积神经网络的一些细节

节选自语义分析的一些方法(二),以后会不断补充。——by wepon 结合文献『Deep Learning for Computer Vision』, 以下讲讲卷积神经网络的一些注意点和问题。 激励函数,要选择非线性函数,譬如tang,sigmoid,rectified liner。在...

2015-02-27 19:35:11

阅读数:4895

评论数:0

《Python核心编程》笔记 基础

春节终于over了,回归充实的学习研究生活。打开久违的CSDN博客,看到官方推送的 『博客Markdown编辑器上线啦』,让我顿时有了写作的欲望,真是程序员的福利。之前阅读各种文章书籍,都是用MarkDownPad做的笔记,喜欢以及习惯于MarkDown简洁的语法。总之各种方便。为了试试效果,将以...

2015-02-27 11:22:18

阅读数:2060

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭