完全立方体计算的多路数组聚集(MultiWay)

最新推荐文章于 2023-02-02 20:03:07 发布

小木屑

最新推荐文章于 2023-02-02 20:03:07 发布

阅读量3.1k

点赞数 7

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xtsylc/article/details/21796017

版权

数据挖掘专栏收录该内容

6 篇文章 1 订阅

订阅专栏

看数据挖掘书的时候，遇到该算法，郁闷了好几天终于搞明白了，现在分享一下自己的理解。这里只解释一下3-D数组中2-D数组的计算，3-D数组的图可以参照《数据挖掘概念与技术(韩家炜)》中的数据立方体中的图。

多路数组聚集算法，该算法的思想是(也算是最后的结论)：“将最小的平面放在内存中，对最大的平面每次只是取并计算一块”。

该算法的核心是：“用一个二维数组缓存一个2-D立方体的计算结果”。

该3-D立方体包含三个维A,B,C。对于维A,B,C数组大小分别是40,400,4000。每个维分为4个相等的分区，共分为64块。

假设计算BC方块中的 b₀c₀块，在内存中为该块分配存储空间，我们按照1-64的顺序扫描，该块计算完成之后就可以从内存中取出，写入硬盘。要想计算该块，我们可以分配一个二维数组，则二维数组大小必须为100*1000，即BC平面的一块。当我们计算完之后，b₀c₀,就可以写入硬盘。当我们计算a₀c₀,因为我们只有在扫描到第13块时才可以计算，我们不得不缓存的数据大小为40*1000（即至少缓存前四块的大小），计算a₀b₀,时，因为要扫描到第49块，所以我们不得不缓存的数据大小为40*400（即需要缓存AB整个平面大小）

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。