数据质量论文阅读
文章平均质量分 91
Neil_zk
这个作者很懒,什么都没留下…
展开
-
条件函数依赖
1原创 2021-03-05 18:15:54 · 1521 阅读 · 1 评论 -
[论文阅读]Discovering Conditional Functional Dependencies
摘要:本文研究了条件函数依赖关系的发现问题。CFDs是最近对函数依赖(FDs)的扩展,它支持语义相关常量的模式,可以用作清理关系数据的规则。然而,寻找CFDs是一个昂贵的过程,涉及大量的手工工作。为了有效地识别数据清理规则,我们开发了从样本关系中发现CFDs的技术。我们提供了CFD发现的三种方法。第一种方法称为CFDMiner,它基于挖掘闭合项集的技术,用于发现常量CFD,即只有常量模式的CFD。第一个算法称为CTANE,是一个扩展了TANE的水平算法,TANE是一个用于挖掘FDs的著名算法。另一种称为原创 2021-02-19 20:59:16 · 1154 阅读 · 3 评论 -
[论文阅读]TANE: An Efficient Algorithm for Discovering Functional and Approximate Dependencies
发现函数和近似依赖关系的有效算法1、函数依赖性和近似依赖性函数依赖是数据库关系内属性之间的一个关系:函数依赖表示属性的值是唯一被其他属性值所决定的。例如:在一个地址数据库中,邮编是被城市和街道地址所决定的。函数依赖关系的发现引起了人们极大的兴趣。当然,自动化数据库分析对于知识发现和数据挖掘(KDD)来说是很有趣的。例如,考虑一个包含化合物及其在各种生物测定中的结果的数据库。发现一种化合物的基本性质,如致癌性,在功能上依赖于某些结构属性是非常宝贵的。函数依赖在数据库管理、逆向工程和查询优化[.原创 2021-02-19 16:12:28 · 1630 阅读 · 0 评论 -
On Equality-Generating Dependencies in Ontology Querying - Preliminary Report
摘要在基于本体的数据访问中,通过提供感兴趣领域的表示的本体来查询数据。在这种情况下,正确的答案是由数据和本体论构成的逻辑理论所包含的答案。传统的数据库约束,如元组生成依赖和等式生成依赖,是本体规范的有用工具。然而,它们的相互作用通常会导致查询回答的困难或不确定性;可分离性是一个概念,它抓住了转化生长因子和表皮生长因子之间缺乏相互作用的问题。在本文中,我们展示了一个新的和一般的可分性的充分条件,在这种情况下,本体用包含依赖(包含依赖的子类)和包含依赖表示。...原创 2021-02-05 19:01:25 · 231 阅读 · 0 评论 -
[论文阅读]《Using Conditional Functional Dependency to Discover Abnormal Data in RDF Graphs》阅读笔记
摘要关系数据中的许多数据质量问题都得到了研究,如数据一致性、重复数据删除、数据准确性、数据完整性等。本文主要研究RDF图中异常数据的发现。随着RDF数据量的增加,数据质量成为这些RDF存储库可用性的一个重要问题。虽然关联规则已经被用来发现RDF图中的异常,但是现有的解决方案忽略了RDF图中连接结构的潜在语义。为了检测RDF图中潜在的依赖关系,首先,我们创新性地定义了一个基于图的条件函数依赖关系(GCFD),它可以统一地表示RDF数据的属性值和语义结构依赖关系。然后,我们提出了一个有效的框架和一些新的剪枝原创 2021-01-29 01:24:37 · 600 阅读 · 2 评论 -
[论文阅读]Capturing Associations in Graphs 阅读笔记
GARs:用来表示图中实体之间的规律性。GAR是图形模式和依赖关系的组合;它可以将用于链接预测的机器学习分类器作为谓词。GARs帮助我们捕捉无模式图中的不完整信息,预测社交图中的链接,识别数字营销中的潜在客户,并扩展图的功能依赖(GFDs)来捕捉缺失的链接和不一致。本文用chase的形式形式化了与GARs的关联演绎,并证明了它的Church-Rosser性质。证明了GARs的可满足性、蕴涵和关联演绎问题分别是coNP-complete、NP-complete和NP-complete的,尽管GARs的表达原创 2021-01-22 09:58:47 · 1096 阅读 · 1 评论 -
[论文阅读]《Discovering Graph Functional Dependencies》阅读笔记
1、符号介绍有向图G = (V,E,L,FA),其中V是有限的节点集合;E是(v,v')中v到v'的边的集合,v和v'是V中的节点;L是节点和边的标签,L(v)∈Θ,L(e)∈Θ;FA是一个等式元组;若对于每个节点v和边e,V'⊆ V,E′⊆ E,L′(v) = L(v),FA'(v) = FA(v),则G'是G的子图,表示为G'=(V′,E′,L′,FA')图形模式,其中VQ是模式节点的集合;EQ是模式边的集合;LQ是模式节点和模式边的标签;是变量的列表;µ一个将映射到VQ的双射函数;...原创 2020-12-30 23:51:26 · 1179 阅读 · 3 评论 -
Keys for graphs阅读笔记
1、我们提出了一类图的键,我们根据图形模式定义键,以指定识别实体所需的拓扑约束和值绑定。此外,关键字可以递归定义:为了识别一对实体,我们可能需要决定是否能够识别其他一些实体,如所示。我们通过子图同构的图模式匹配来解释关键字。这使得这样的键比我们熟悉的关系和XML键更具表现力。2、我们研究实体匹配,这是图的键的应用。给定一个图G和图的一组键Σ,实体匹配就是寻找G中所有可以被Σ中的键识别的实体(顶点)对。我们通过修正经典依赖理论中研究的chase [3]来形式化这个问题。当实体匹配对于关系和具有传统关键字的原创 2020-12-25 02:26:30 · 457 阅读 · 0 评论 -
Dependencies for Graphs 阅读笔记
本文提出图实体依赖关系(GEDs graph entity dependencies)GED被定义为图形模式和属性依赖的组合GEDs可以用常量文字来表示图的函数依赖关系,以捕捉不一致,用带有id文字的键来标识图中的实体(顶点)我们修改了对GEDs的追逐,并证明了它的教会-罗塞尔性质我们刻画了GED的可满足性和蕴涵,并建立了这些问题的复杂性和GED的验证问题,存在和不存在常量文字和id文字。我们还开发了一个完善的、完整的、独立的有限蕴涵几何系统我们用内置谓词或析取来扩展GEDs,以在表原创 2020-12-25 02:24:13 · 709 阅读 · 0 评论 -
[论文阅读]Functional Dependencies for Graphs 阅读笔记
摘要本文提出一种图函数依赖,称之为GFDs。GFDs捕捉属性-值依赖和实体拓扑结构,并且包含了CFDs是一个特例。GFDs的满意度和蕴含问题分别是coNP-complete和NP-complete,即满意度和蕴含问题分别是决定是否存在一个非空的图满足Σ中的所有GFDs和Σ是否包含GFD。。GFDs的验证问题是coNP-complete的提出了两种并行可测量的算法用于检测GFDs的违规本文提出了大量的例子,以便于读者理解概念的含义介绍例1:(1)知识库中的不一致是常见的:航原创 2020-12-11 19:33:59 · 1211 阅读 · 0 评论