输入: HDFS 分布存储的海量图像
输出:图像检索结果
MAP:
① 初始化键值, key:图像特征的所属位置, value:图像的特征属性;
② 调用图像相似判断函数, 计算图像特征的相似度;
③ 根据检索规则, 计算匹配的相似度;
④ 输出中间结果。
REDUCE:
① 调用 Map 输出的中间结果, key:图像特征的相似度, value:图像编号;
② 如果结果的 key 值相同, 将其 value 合并在一起;
③ 按照相似度由大到小的顺序, 对约简后的结果排序;
④ 输出检索结果。
实验环境:
实验中集群环境包含由普通计算机构成的 10 个节点, 其中 1 台计算作为管理节点, 其余为计算节点。每个节点的硬件配置为:双核 2.0 GHz CPU, 4 GB 内存, 500 GB 硬盘, 百兆计算及存储网络; 软件环境采用 RedHat Linux 操作系统。采用 10 万张网络图像作为测试图像集。
实验结果:
摘自:《基于大数据挖掘的图像检索方法研究》赵 婕(太原学院计算机工程系) , 姚峰林 (太原科技大学机械工程学院)