搜索引擎
knzeus
风物长宜放眼量
展开
-
数学模型的重要性
-摘选自 数学之美 谈谈数学模型的重要性1. 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。) 2. 一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。) 3. 大量准确的数据对研发很重要。 4. 正确的模型也可能受噪音干扰,而显得不准确;这时我们不应该用一种凑合的修正方法转载 2009-10-20 10:47:00 · 385 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类 <br /> 赵 晨婷, 软件工程师, IBM马 春娥, 软件工程师, IBM<br />简介: 智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。聚类 (Clustering) 是一个数据挖掘的经典问题,它的目的是将数据分为多个簇转载 2011-05-24 20:50:00 · 613 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤 赵 晨婷, 软件工程师, IBM马 春娥, 软件工程师, IBM简介: 本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的转载 2011-05-24 20:28:00 · 359 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探 <br /> 赵 晨婷, 软件工程师, IBM马 春娥, 软件工程师, IBM<br />简介: 随着 Web 技术的发展,使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求转载 2011-05-24 20:30:00 · 539 阅读 · 2 评论 -
向量相关性
http://woodstudio.iteye.com/blog/141005 <br /><br /><br />Pearson相关系数 - Pearson's Correlation Coefficient<br /> <br /> <br />关键字: pearson's correlation coefficient Pearson相关系数用来衡量两个数据集合是否在一条线上面。其计算公式为:<br /><br /><br />一个具体的计算的例子:X Y<br />转载 2011-04-12 21:36:00 · 604 阅读 · 0 评论 -
jaccard相似度计算公式
<br />简单介绍一下Jaccard系数:广义Jaccard系数可以用于文档数据,并在二元属性情况下归约为Jaccard系数。广义Jaccard系数又称Tanimoto系数。(有另一种系数也称为Tanimoto系数)。该系数用EJ表示,由下式定义:<br />EJ(x,y)=(x*y)/(||x|*||x||+||y||*||y||-x*y)<br />其公式与余弦相似度的计算有点相似<br /> <br />http://hi.baidu.com/soulingm/blog/item/28ff4转载 2011-04-12 22:04:00 · 6025 阅读 · 1 评论