- 博客(4)
- 收藏
- 关注
原创 二分搜索
def binary_search(sorted_list,value): low = 0 high = len(sorted_list) - 1 while(low value): high = mid - 1 else: low = mid + 1 return -1l = [0,10,15,21,34,45,56,77,88,91,100]print binary_search(l,0)
2012-06-05 15:11:27 246
原创 推荐系统的数据挖掘方法
1. 推荐系统中的数据挖掘流程2. 数据预处理 (1) 相似性度量 欧式距离 闵可夫斯基距离 协方差距离(Mahalanobis distance) Cosine distancePearson distance 常用的距离:Pearson distance 和 cosine distance3. 采样 sampling、 参看数据挖掘的教材4. 降维 ---Reducing dimansionality 主要
2011-02-26 13:44:00 826
翻译 Recommender System 用到的降维算法---PCA简介
<br /> 主元分析(PCA)理论分析及应用什么是PCA?<br /> PCA是Principal component analysis的缩写,中文翻译为主元分析。它是一种对数据进行分析的技术,最重要的应用是对原有数据进行简化。正如它的名字:主元分析,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。因此应用极其广泛,从神经科学到计算机图形学都有它的用武之地。被誉
2011-02-26 10:46:00 1655
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人