- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 [算法5]PCA降维
最近在做文本聚类和用kd-tree关联文档,头疼于所谓的文本处理的高维诅咒,决定写一个降维算法。从降维算法最常见的入手,which is PCA,又叫出成分分析。PCA是利用了协方差的概念,将多维度的矩阵之间维度建立一个关系,然后拉伸原有的多维度,组合成新的低维度空间,投影原有的多维矩阵到低维空间中,尽量的保证原有的各个样本间关系损失小。步骤:将数据建立一个M*
2014-05-13 17:39:23 1138
原创 [算法4]TF-IDF算法
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。
2014-05-05 16:48:34 1433
innovation management and new product development
Innovation Management and New Product Development原版书
2012-12-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人