《实体解析与信息质量》- 创作动力

实体解析(ER )和信息质量( IQ)是信息科学领域的两门新兴学科。我寄望这本书能够为该领域不断增长的知识储备做出一定的贡献。

我觉得参与发起一门新兴学科是一件很有意义的事情,籍此来组织信息质量学科的第一个研究生学位课程,则犹如一段令人兴奋的旅程。这其中的一个重要挑战,便为学生们寻找合适的书籍和学习资源, 因为关于这些主题大学水平的教科书实在是少之又少。 比如《Introduction to Information Quality*》, 《Journey to Data Quality**》这些著作都是由非该学科的其他行业的从业者所著。不过,我认为这也并非全然坏事。教学中我们还使用了一些非常详细且实用的书籍作为教材,也因而获得了学生和教师的一致好评。比如《 Data QualityAssessment(Arkady Madanchik著)》和《 Executing Data Quality Projects: Ten Steps to Quality Data andTrusted Information》。当然,我坚信随着越来越多的学校开设这方面的课程,将会有更多出色的教科书涌现,以满足教学的需求。

该书基于阿肯色大学于2009年秋天开设的,名为实体解析和信息质量的研究生选修课程。在该课程中, 我们主要使用了由  ThomasHerzog, Fritz Scheuren 和 William Winkler 合著的《信息质量和记录链技术》。该书在关于 价值推算, Fellegi-Sunter 记录链接模型的描述,以及一些案例研究方面的内容十分值得推荐,但另一方面,它并没有能够覆盖实体解析的很多其他课题。

当你阅读本书时,特别是第 2章,你会看到比较全面的,关于信息质量的基础知识的介绍。同样出现在第二章里的,还有信息和数据质量国际发展协会( IAIDQ)指定的,关于信息质量的知识和技能的六个领域框架,我认为该框架为这门新兴学科建立出色的基本准则。同时,该书还从侧面佐证了许多目前流行的信息技术和信息管理的主题,如主数据管理和信息治理,它们也都遵循了该信息质量的基本原则。而其他许多譬如实体和身份识别的应用技术,也和信息架构与数据质量存在非常紧密的联系。

 

除了和信息质量相关的内容,该书也介绍了有关实体解析的基础知识。我编写该书的其中一个目标,便是鼓励实体解析和信息质量的研究与参与人员能建立起关于这两个两个学科全面的,互相印证的整体观点。

我注意到,已经有许多在这些领域的高素质从业人员和研究人员,曾经发表过相关著作。例如,我们不难找到关于实体解析几乎任何一个主题的有深度的论文。我希望这本书能够将各个地方更零散的主题结合起来,构建一个关于实体解析的整体框架,并通过这样做来促进其中的思想和技术的相互交流。不是每个人都会完全接受我的定义或分类方式,但这是我提供给读者的审议意见。毕竟,任何知识的增长,都需要考察和审视不同的观点,并基于他人的工作成就,才能在点滴中得到积累。

 

(*由 Craig Fisher, EitelLauria, Shobha Chengalur-Smith, and Richard Wang 合著)

(**  Yang Lee, Leo Pipino, James Funk, and Richard Wang合著)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值