![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
实时大数据分析
文章平均质量分 71
gdut_yy
这个作者很懒,什么都没留下…
展开
-
(精)广东工业大学 2018实时大数据分析——A-Priori算法实验报告
实时大数据分析实验一——A-Priori算法一、实验内容给定某超市购物篮数据库文件basketdata.xls,里面有18项商品的747条购买记录。取支持度阈值s =185,用A-Priori算法在Map-Reduce框架下提取其中的最大频繁项集Lk。附件:某超市数据集basketdata.xls二、实验设计(原理分析及流程)该算法的基本思想是:首先找出所有的频集,这些...原创 2018-05-30 11:11:55 · 1564 阅读 · 0 评论 -
(精)广东工业大学 2018实时大数据分析——k-means算法实验报告
(精)广东工业大学 2018实时大数据分析——k-means算法实验报告一、实验内容给定国际通用UCI数据库中FISHERIRIS数据集,其meas集包含150个样本数据,每个数据含有莺尾属植物的4个属性,即萼片长度、萼片宽度、花瓣长度,单位为cm。上述数据分属于species集的三种setosa、versicolor和virginica花朵类别。 要求在该数据集上用MapReduce结...原创 2018-05-30 12:33:03 · 3179 阅读 · 0 评论 -
(精)广东工业大学 2018实时大数据分析——PageRank算法实验报告
(精)广东工业大学 2018实时大数据分析——PageRank算法实验报告一、实验内容1.采用基于“抽税”法在MapReduce框架下,分析图1的网页PageRank排名;2.图1中,若节点②和节点⑤是主题节点,采用面向主题的PageRank算法重新计算所有节点的PageRank值。二、实验设计(原理分析及流程)三、实验代码及数据记录1.代码1.0 文件...原创 2018-05-30 12:35:28 · 2732 阅读 · 1 评论 -
(精)广东工业大学 2018实时大数据分析——Shingling&Minhash实验报告
(精)广东工业大学 2018实时大数据分析——Shingling&Minhasn实验报告一、实验内容采用Shinling及Minhash技术分析以下两段文本的Jaccard相似度:(1) The TOEFL test is an English language assessment that is often required for admission by English...原创 2018-05-30 12:39:41 · 2735 阅读 · 0 评论