自制图片搜索引擎(三)


第二步:从数据集提取特征

上篇里我们已经定义好了图像描述符。接下来我们就要对数据集的每一幅图像提取特征并将其保存起来,这个过程称为索引化

代码

创建一个新文件夹,index.py

#导入所需模块
#argparse模块来处理命令行参数.glob来获取图像的文件路径
from pyimagesearch.colordescriptor import ColorDescriptor
import argparse
import glob
import cv2

#处理命令行参数,需要两个指令,-dataset,表示相册的路径,-index,表示输出的CSV文件含有图像文件名和对应特征
ap=argparse.ArgumentParser()
ap.add_argument("-d","--dataset",required=True,help="Path to the directory that contains the image to be indexed")
ap.add_argument("-i","--index",required=True,help="Path to where the computed index will be stored")
args=vars(ap.parse_args())

#初始化ColorDescriptor,8bin用于色相,12bin用于饱和度,3bin用于明度
cd=ColorDescriptor((8,12,3))

现在所有内容都初始化了,可以从数据集提取特征了.

#打开输出的索引文件以写入
output=open(args["index"],"w")

#用glob来获取图片路径以遍历数据集中的所有图像
for imagePath in glob.glob(args["dataset"]+"/*.png")
    #对于没副图像我们可以提取一个imageID,即图像的文件名.
    imageID=iamgePath[iamgePath.rfind("/")+1:]
    image=cv2.imread(imagePath)

    #现在图像载入内存了,对图像使用图像描述符并提取特征。ColorDescriptor的describe方法返回由浮点数构成的列表,用来量化并表示图像。
    features=cd.describe(image)

    #将图像的文件名和特征向量写入文件
    features=[str(f) for f in features]
    output.write("%s,%sn" % (imageID,",".join(features)))

output.close()

现在,为了索引化我们的相册数据集,打开一个命令行输入下面命令:

$ python index.py --dataset dataset --index index.csv

这个脚本运行完成后 可以获得一个名为index.csv的新文件

可以看到在.csv文件的每一行,第一项是文件名,第二项是一个数字列表。这个数字列表就是用来表示并量化图像的特征向量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值