参与计算机隐私保护活动的产业,分布式环境下关联规则挖掘的隐私保护方法研究-计算机软件与理论专业论文.docx...

分布式环境下关联规则挖掘的隐私保护方法研究-计算机软件与理论专业论文

南京邮电大学硕士研究生学位论文摘要

南京邮电大学硕士研究生学位论文

摘要

I

I

摘 要

随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘 等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑 战,隐私保护数据挖掘(PPDM)也已经成为数据挖掘(DM)领域的一个重要课题。关联规则 挖掘是应用最为广泛的数据挖掘方法之一。本文对分布式环境下关联规则挖掘的隐私保护 方法进行研究,目的就是在最大化地挖掘出数据库中潜藏的知识的同时保护数据隐私。

本文从敏感数据的保护和敏感知识的保护两个方面,介绍了数据挖掘中常用的隐私保 护技术;在概述了数据挖掘技术的基础上,重点介绍了分布式关联规则挖掘的原理和流行 的算法,分析了各种算法的优缺点。在此基础上,本文针对分布式关联规则挖掘中敏感知 识的保护进一步做了以下研究工作:

(1)对于水平划分的数据集,设计了一种在本站点隐藏敏感规则的数据清洗算法。该 算法在对本站点的数据集做最小改动的基础上,实现了对本站点数据集中敏感规则的完全 隐藏,较大程度地保证了全局挖掘结果的准确性和对敏感规则的隐藏效果。此外,还采用 RSA加密与同态加密相结合的加密方案对各个站点之间传送的频繁项集信息进行加密,该 方案综合考虑了数据加密的安全性和加密算法的高效性,达到了效率与安全的平衡。

(2)对于垂直划分的数据集,分布式关联规则挖掘的隐私保护的关键在于安全地计算 全局频繁项集。本文提出一种新的安全求项集支持度的协议,该协议可以在准确地求出项 集的支持度的同时不泄露各个站点的私有信息。

(3)对文中设计的相关算法做了实验,实验结果表明这些算法具有较好的隐私保护性、 准确性和高效性。

论文在分布式环境下关联规则挖掘的隐私保护方面做了有益的工作。 关键词:分布式环境;隐私保护;关联规则挖掘

南京邮电大学硕士研究生学位论文ABS

南京邮电大学硕士研究生学位论文

ABSTRACT

ABSTRACT

Along with the rapid development of network, communications and computer technology, data mining takes on the features of large datasets and distributed mining. How to preserve data privacy and prevent sensitive information from disclosure has become a great challenge. Privacy preserving data mining (PPDM) has become an increasingly important issue in data mining data mining(DM) field. Association rule mining is one of the most widely used data mining methods. In this thesis, the methods of privacy preserving for association rule mining in distributed environment are studied, the purpose of the study is to maximize mining the potential knowledge in the database and protect data privacy at the same time.

This thesis introduces several privacy preserving technologies which are commonly used in data mining from two aspects: the protection of sensitive data and the protection of sensitive knowledge. On the basis of the overview of data mining technology, the thesis introduces theories of distributed association rule mining, analyzes several popular existing distributed association rule mining algorithms and their advantages and disadvantages. Then, the

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值