计算机学院学院简介PPT,山东大学计算机学院.ppt

文档介绍:

山东大学计算机学院MakingInterval-BasedClusteringRank-Aware报告人:李婷山东大学计算机学院出处: InternationalConferenceonExtendingDatabaseTechnology作者:JuliaStoyanovich,SihemAmer-Yahia,TovaMiloUniversityofPennsylvaniaPhiladelphia研究方向:Databases、Webdatamanagement、WebservicesandWebapplications、BusinessProcesses山东大学计算机学院ContentsI.IntroductionII.FormalismIII.TheBARACAlgorithmIV.Evaluationofeffectiveness山东大学计算机学院I.IntroductionIndatingsites,ausermayspecifytheage,height,e,education,politicalaffiliation,andreligionofapotentialmatch.Inrealestateapplications,ausermaydescribehisdreamhomebyitslocation,size,andnumberofbedrooms.Thenumberofmatchesisoftenveryhigh,makingdataexplorationaninterestingchallenge.Typicallyusersalsospecifyrankingcriteriafortheretrieveditems,e.g.,asortorderonasingleattribute,binationofmultipleattributes.排序帮助用户,依据他们的标准提供高质量的数据,同时导致同类的匹配数据,用户需要浏览大量的数据后,才能找到下一类数据。.山东大学计算机学院I.Introduction例如:adatingwebsite用户:lookingforapartnerbetween20and40yearsold,efromhighertolower结果:seeingalargenumberofmatchesintheirlate30swhoholdanMBAdegreeandworkinthefinancialindustry,beforeseeinganymatchesindifferentagegroupsandwalksoflife.更合理的结果展示:在结果集中,找到数据属性的聚类。Theseclustersmaydescribematchesbetween35and40withanMBA,matchesbetween25and30whoworkinthesoftwareindustry,etc.,allowingfordataexplorationofrankedresults.山东大学计算机学院I.Introduction本文提出的聚类算法,得到的聚类具备三个性质:.1)ClusteringQualityrank-awareclusteringqualityMeasures(1)QtopN:treatthetopNitemsofeachintervalassets(2)QSCORE:accountforthescoresoftheitems(3)QSCORE&RANK:accountforbothscoresandranks2)Tightness对于一个有序区间,两个或多个连续的区间连接在一起,会产生一个更大的区间,但是并不一定增加新的items,因此可能会产生一个错误的聚类描述。例如:按收入从高到底排序,我们发现20到24岁的得分要低于25到29岁的用户。也就是20到29岁包含的items与25到29岁的一致,认为这个聚类不紧密。3)Maximality需要发现与区间集合下尽可能多的items。例如:intervalsI1:age∈[20,29],I2:edu=MBA,andI3:e∈[75K,100K].IftwodimensionalclustersI1、I2,I1、I3,andI2、I3arediscovered,aswellasathree-dimensionalclusterI1、I2、I3,thenonlyI1、I2、I3ispresentedtotheuserI.Introduction-Contributions定义了基于区间的感知顺序的聚类,及相应的衡量聚类质量策略方法。提出了一个算法BARAC,自上而下的聚类算法,并验证了方法的有效性。.II.Formalism—A

内容来自淘豆网www.taodocs.com转载请标明出处.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值