自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 mrjob文档

mrjob的最简单sample是一个计数的程序

2014-05-22 18:28:51 2397

原创 [算法5]PCA降维

最近在做文本聚类和用kd-tree关联文档,头疼于所谓的文本处理的高维诅咒,决定写一个降维算法。从降维算法最常见的入手,which is PCA,又叫出成分分析。PCA是利用了协方差的概念,将多维度的矩阵之间维度建立一个关系,然后拉伸原有的多维度,组合成新的低维度空间,投影原有的多维矩阵到低维空间中,尽量的保证原有的各个样本间关系损失小。步骤:将数据建立一个M*

2014-05-13 17:39:23 1137

原创 [算法4]TF-IDF算法

TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。

2014-05-05 16:48:34 1431

原创 [算法3]Kmeans算法

面试中,经常问面试者,你熟悉神马算法,然后得到的回复普遍就是,

2014-05-04 14:42:28 1024

原创 [算法2]相似度度量算法

相似度算法是机器学习算法的最基础

2014-05-03 20:39:35 1663

原创 [算法1]皮尔逊相关系数

皮尔逊相关系数,(pearson correlation co)

2014-05-02 18:17:29 4107

innovation management and new product development

Innovation Management and New Product Development原版书

2012-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除