二进制哈希:压缩存储(存储空间小)和查询速度快。
核心思想: 通过构造哈希映射函数将高维图像特征-->映射到低维汉明空间,然后以汉明距离(码间异或)作为相似性度量来检索图像。
CT图像的医学体征在识别良性和恶性肺部疾病以及协助医生进行病变诊断方面起着重要的作用。
肺结节的九种医学体征,包括细微,针刺,小叶,钙化,内部结构,边缘,球形,质地和恶性肿瘤。
肺结节图像检索方法主要包括三个部分:
(1)基于九种医学体征构造用于训练集的准确二进制码。(提出了一种编码方法,将十进制整数转换成紧凑的二进制码)
【利用二进制描述符将语义描述符转换为二进制字符串,具有存储空间小、匹配速度快等优点。在本文我们以二进制描述符为参考,提出了一种编码方法,将十进制整数转换成紧凑的二进制码,最终得到精确的二进制码。】
(2)提取肺结节的信息性语义特征并构建哈希函数。
①信息语义特征提取:利用一个CNN框架来学习多层语义特征,然后使用PCA方法来提取信息的语义特征。
主要包含以下几部分:①特征提取层由五个卷积层(conv 1-5)和两个完全连接的层(full 6-7)组成; ②分类层(全层8)在标签上产生分布,如图2所示。
【肺结节图像的语义描述:对肺结节征象的描述;内科医生主要依靠肺结节征象来诊断肺部病变。】
②构建哈希函数:必须尽可能采用保持相似性的哈希函数,以确保将相似的图像映射到汉明空间中的附近二进制代码;因此,哈希函数学习对哈希码具有至关重要的影响。如果哈希码的长度为k,则需要设计一组包含k个哈希函数的函数。
③相似性肺图像检索:步骤1.使用等式(9)(10)计算查询图像和数据集之间的汉明距离,我们获得候选池I;
步骤2.为查询图像的每一位更新权重;
步骤3.计算查询和候选池I之间的加权汉明距离;
步骤4.对结果进行排名,然后选择最小值作为最相似的肺结节图像;
【进行③的原因:Hence, the weighted Hamming distance is used to measure the similari ty of lung nodules.】
(3) 通过提出的加权位搜索方法检索与查询相似的肺结节图像,如图1所示。
(1)通过卷积神经网络和主成分分析提取肺结节图像的语义特征,映射为紧凑的哈希码。
(2)该方法可以在数据库中快速识别出具有相同汉明距离的肺结节图像
------------------------------------------------------------------------------------------------------------------------------------
汉明距离 :
在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:
1011101 与 1001001 之间的汉明距离是 2。
2143896 与 2233796 之间的汉明距离是 3。
"toned" 与 "roses" 之间的汉明距离是 3。