数据挖掘
文章平均质量分 56
xiaocai0807
这个作者很懒,什么都没留下…
展开
-
数据挖掘中的隐私保护
<br />数据挖掘中的隐私保护主要关注两个方面:其一,像身份、姓名、地址和爱好等敏感的原始数据的处理,避免个人隐私信息的泄露。其二,能通过数据挖掘工具得到的敏感知识也应该被排除。隐私保护数据挖掘的主要目标是使用某种方法对原始数据进行处理,使得私有数据和知识在挖掘之后仍然是私有的。 目前,数据挖掘中的隐私保护方法研究主要有:在挖掘算法中建立隐私约束规则、在应用挖掘算法之前对挖掘数据集应用随机化方法、对隐私建立度量评估、取代本样本真实数据、对记录进行交换等,同时还有在分布式环境下的数据挖掘(数据元组水平分布和转载 2010-10-31 23:19:00 · 2336 阅读 · 0 评论 -
数据挖掘VS隐私保护
<br />数据挖掘VS隐私保护<br />早在1998年,Ann Cavoukian发表了一篇题为《数据挖掘:以破坏隐私为代价》的报告,(Alex Berson的新书:<Building Data Mining Applications for CRM>),引起了很大的轰动。该报告剖析了数据挖掘和隐私的关系,指出数据挖掘可能是个人隐私提倡者未来10年所要面对的“最根本的挑战”,从那时起隐私问题就成为让数据挖掘窘迫的雷区,“避雷”自然是少不了的。<br /> <br />初步看来,这方面研究主要从三个角度进转载 2010-10-31 23:19:00 · 2904 阅读 · 0 评论 -
数据挖掘方面的资源网址集合
<br />Journals<br />ACM TKDD http://tkdd.cs.uiuc.edu/<br />DMKD http://www.springerlink.com/content/1573-756X/?p=859c3e83455d41679ef1be783e923d1d&pi=0<br />IEEE TKDE http://www.ieee.org/organizations/pubs/transactions/tkde.htm<br />ACM TODS htt原创 2010-10-29 15:32:00 · 630 阅读 · 0 评论 -
Web分析
<br />Web分析工具概述 <br /><br /><br />挑战 <br /><br />在竞争日益激烈的网络经济中,只有赢得用户才能最终赢得竞争的优势。作为一个网站,你知道用户都在你的网站上干什么吗?你知道你的网站哪些部分最为用户喜爱、哪些让用户感到厌烦?什么地方出了安全漏洞?什么样的改动带来了显著的用户满意度提高、什么样的改动反而丢失了用户?你怎样评价你的网站广告条的效率、你知道什么样的广告条点击率最高吗?“知己知彼,才能百战不殆”,你真的了解自己吗? <br /><br /><br />机转载 2011-02-26 23:49:00 · 479 阅读 · 0 评论 -
决策树技术及当前研究方向
<br />数据挖掘中可以用“决策树”技术进行归纳分类。<br />1.决策树的构造:<br /> 常用的算法有:ID3,C4.5,CART(贪心方法,非回溯的);可伸缩性比较好的有:SLIQ和SPRINT,雨林,BOAT。其中BOAT是可以增量更新的。<br /> <br />2.决策树的约简:<br /> 减小错误修剪法,悲观错误修剪法,基于代价-复杂度的修剪法,代价敏感的决策树修剪法......<br /> 简化决策树的方法绝不止这些,各种不同的方法觉有自己的优点和缺点。实际运用时应根据实原创 2011-05-04 15:32:00 · 1909 阅读 · 0 评论 -
SQL Server 2005 Data Mining简介[转]
SQL Server 2005 Data Mining简介[转]<br />简介<br /> 企业均在尝试分析其数据时都面临若干问题。通常,并不缺乏数据。事实上,很多企业感觉到他们被数据淹没了;他们没有办法完全利用所有的数据,将其变成信息。为了处理这方面的问题,开发了数据仓库技术,以让企业从异构的数据源获取大量数据,并将其变成实用信息。<br /> 恰当实现的数据仓库是具有惊人强大功能的解决方案。公司可以对信息进行分析,并将其加以利用,以进行明智的决策。通过使用数据仓库,可以为您提供以下问题的答转载 2011-05-04 10:16:00 · 571 阅读 · 0 评论