Rachel Zhang的专栏

因为理想,所以拼搏,关注计算机应用的点点滴滴……

Residual Networks <2015 ICCV, ImageNet 图像分类Top1>

本文介绍一下2015 ImageNet中分类任务的冠军——MSRA何凯明团队的Residual Networks。实际上,MSRA是今年Imagenet的大赢家,不单在分类任务,MSRA还用residual networks赢了 ImageNet的detection, localization, ...

2016-01-15 00:04:43

阅读数 24264

评论数 13

python实现并行爬虫

问题背景:指定爬虫depth、线程数, python实现并行爬虫   思路:    单线程 实现爬虫类Fetcher                 多线程 threading.Thread去调Fetcher  方法:Fetcher 中,用urllib.urlopen打开指定url,读取信息:r...

2015-09-07 20:06:51

阅读数 19076

评论数 4

Python数据可视化——散点图

本文记录了python中的数据可视化——散点图scatter,令x作为数据(50个点,每个30维),我们仅可视化前两维。labels为其类别(假设有三类)。这里的x就用random来了,具体数据具体分析。label设定为[1:20]->1, [21:35]->2, [36:50]-&g...

2015-06-10 10:58:47

阅读数 142986

评论数 20

经典统计语言模型

本文介绍三个经典统计语言模型, HAL,LSA, 与COALS.

2015-06-01 23:11:24

阅读数 11910

评论数 3

Image classification with deep learning常用模型

本文中,我会根据下大家image classification常用的cnn模型,针对cifar10(for 物体识别),mnist(for 字符识别)& ImageNet(for 物体识别)做一个model 总结。 本文不讲coding(coding请见Convolution Neural...

2015-01-07 16:07:31

阅读数 32301

评论数 46

Deep learning From Image to Sequence

本文笔记旨在概括地讲deep learning的经典应用。内容太大,分三块。 1. 回顾 deep learning在图像上的经典应用 1.1 Autoencoder 1.2 MLP 1.3 CNN<详细的见上一篇CNN> 2. deep learning处理...

2014-10-10 09:19:50

阅读数 21313

评论数 6

Matrix Factorization, Algorithms, Applications, and Avaliable packages

来源:http://www.cvchina.info/2011/09/05/matrix-factorization-jungle/美帝的有心人士收集了市面上的矩阵分解的几乎所有算法和应用,由于源地址在某神秘物质之外,特转载过来,源地址Matrix Decompositions has a lon...

2014-06-13 00:12:34

阅读数 10643

评论数 5

GMM-HMM语音识别模型 原理篇

本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题: 1. 什么是Hidden Markov Model? 2. GMM是神马?怎样用GMM求某一音素(phoneme)的概率? 3. 用GMM+HMM大法解决语音识别

2014-05-28 20:52:33

阅读数 76222

评论数 44

Convolution Neural Network (CNN) 原理与实现

本文结合Deep learning的一个应用,Convolution Neural Network 进行一些基本应用,参考Lecun的Document 0.1进行部分拓展,与结果展示(in python)。 分为以下几部分: 1. Convolution(卷积) 2. Pooling(降采样...

2014-05-15 20:51:07

阅读数 99681

评论数 55

MC, MCMC, Gibbs采样 原理&实现(in R)

本文用讲一下指定分布的随机抽样方法:MC(Monte Carlo), MC(Markov Chain), MCMC(Markov Chain Monte Carlo)的基本原理,并用R语言实现了几个例子: 1. Markov Chain (马尔科夫链) 2. Random Walk(随机游走) 3...

2014-05-15 19:50:44

阅读数 73777

评论数 29

python并行调参——scikit-learn grid_search

上篇应用scikit-learn做文本分类中以20newsgroups为例讲了如何用三种方法提取训练集=测试集的文本feature,但是 vectorizer取多少个word呢? 预处理时候要过滤掉tf>max_df的words,max_df设多少呢? tfidftransformer只用t...

2014-04-17 14:12:28

阅读数 33671

评论数 16

应用scikit-learn做文本分类

文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言告知下现在的benchmark,万谢! 嗯,说正文。20newsgroups官网上给出了3个数据集...

2014-04-13 20:53:15

阅读数 91977

评论数 54

Decision Tree 及实现

本文基于python逐步实现Decision Tree(决策树),分为以下几个步骤: 1.加载数据集 2.熵的计算 3.根据最佳分割feature进行数据分割 4.根据最大信息增益选择最佳分割feature 5.递归构建决策树 6.样本分类 将分别体现于代码。

2014-03-17 12:12:15

阅读数 27163

评论数 41

K近邻分类算法实现 in Python

K近邻(KNN):分类算法* Machine Learning的Python库很多,比如mlpy,这里实现只是为了掌握方法* MATLAB 中的调用,见《MATLAB分类器大全(svm,knn,随机森林等)》* 算法复杂度高(可用KD树优化,C中可以用libkdtree或者ANN)* k越小越容易...

2014-03-02 14:37:24

阅读数 19568

评论数 14

R语言 基本数据分析

本文基于R语言进行基本数据统计分析,包括基本作图,线性拟合,逻辑回归,bootstrap采样和Anova方差分析的实现。不多说,直接上代码,代码中有注释。1. 基本作图(盒图,qq图)#basic plot boxplot(x) qqplot(x,y) 2.  线性拟合#linear regres...

2014-02-08 23:52:14

阅读数 32166

评论数 4

Matlab并行编程方法

本文讲一下matlab中的并行方法与技巧。分为以下几个板块: 1. 什么东西好并行? 2. 怎么并行? 3. parfor vs. SPMD 4. 注意事项及经验总结

2014-01-03 08:08:27

阅读数 101230

评论数 10

MatLab2012b/MatLab2013b 分类器大全(svm,knn,随机森林等)

train_data是训练特征数据, train_label是分类标签。Predict_label是预测的标签。MatLab训练数据, 得到语义标签向量 Scores(概率输出)。1.逻辑回归(多项式MultiNomial logistic Regression)Factor = mnrfit(t...

2013-12-05 10:50:30

阅读数 53980

评论数 6

Comprehensions on Group NMF

最近看了一下group sparsity和group structure方面的东西,本文主要针对了其中一种在NMF上的应用得到的group sparsity总结了一些东西。这篇理论上的文章没有被引用很多,但是其在EEG上用Group NMF做得一篇文章倒是有些影响力的。具体参考reference吧...

2013-06-27 13:11:53

阅读数 10621

评论数 6

The culture of Statistic Learning

在MIT 150周年庆的Brains, Minds, and Machines研讨会上, Prof. Noam Chomsky发表了一个观点,他的大概意思是有很多语言模型采用统计的方法建模,有些取得了成功,但他觉得大多数是失败的,他觉得应该更多重视简洁的,公式化的理论,而非这些统计上的结论,正如下...

2012-12-04 01:41:42

阅读数 8850

评论数 17

GMM的EM算法实现

在 聚类算法K-Means, K-Medoids, GMM, Spectral clustering,Ncut一文中我们给出了GMM算法的基本模型与似然函数,在EM算法原理中对EM算法的实现与收敛性证明进行了详细说明。本文主要针对如何用EM算法在混合高斯模型下进行聚类进行代码上的分析说明。1. G...

2012-11-19 11:03:16

阅读数 119582

评论数 81

提示
确定要删除当前文章?
取消 删除