自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

翻译 《实体解析与信息质量》-1.2.6.总结

总结实体解析就是对引用做出判断,它是否指相等是向现实世界的实体。链接是一个附加的共通的实例引用以此标识他们是等价的。身份识别,记录链接,记录匹配,记录去重,合并清除,还有实体解析这些都代表了ER的特定形式或方面。广义地来说,ER包含五个主要步骤:实体引用抽取,实体引用准备,实体引用解析,实体身份管理,和实体关系分析。 在这5个步骤中精确和模糊匹配是很重要的工具,但是引用的直接匹配并不是

2015-03-30 15:40:12 912

翻译 《实体解析与信息质量》-1.2.5.实体关系分析

实体关系分析在等价的引用被转变和识别后,许多应用提出了另一个问题:这些实体间的多样化的关系是怎样的?这其中,第一个被探索的实体关系是家庭关系(Household Relationship),即不同的实体居住在同一个家庭里,营销公司最先看到这其中的价值。有趣的是,到目前为止,家庭关系仍是最难定义和管理的。对此最简单的定义方式是:住在同一个地方有着相同姓氏的人。这样的定义简单易行,但它并不能觉察文

2015-03-24 09:26:11 1151

原创 推荐系统之实践篇

前言 推荐就是销售,目的就是把商品卖出去。那么如何像导购员那样把商品推荐并且销售出去呢?这里面就有两个方面的问题,一是如何精准的推荐用户想要的商品?二是如何精准的找到喜欢该商品的用户?推荐系统其实就是主要完成这个两件事。基于之前已有产品的一些业务,本文主要从第二个角度做一些实践和尝试。 本文假设是基于三方面的数据:电商A、社交网络B、传统企业C。需要解决的问题是搭建一个平台D,使传

2015-03-16 15:00:08 1484 1

翻译 《实体解析与信息质量》-1.2.4.实体身份管理

实体身份管理ER中另一个很重要的概念就是实体身份。根据Lim,Srivastava,Probhakar and Richardson(1993)的定义,实体身份就是该实体的一系列属性值,在特定上下问中,通过一定的无差别的规则,可以通过这些属性将该实体与其他所有同类实体区分开来。从这个定义似乎可以得出,ER过程总是可以通过对这些身份属性进行匹配来完成。然而还有以下这些原因是的直接匹配无法总是称为

2015-03-06 10:54:37 1467

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除