前面两篇文章插播了爬取爱彼迎数据的方法。经过几天几夜的艰苦奋斗,终于拿到了大量数据,可以进行批量处理图像的HSV值了。
这里的批量处理,其实就是用了一个for循环。
①通过爬取到的图片url批量下载图片,并用房源ID来命名,保存在C:\Users\p\Desktop\Airbnb_pic文件夹下面。
这里使用的是八爪鱼的图片下载采集器,很简单,具体怎么下载以及怎么使用,见八爪鱼官网,有下载包和视频教程:
https://www.bazhuayu.com/tutorial8/81sptpcjxz
②导入图片,调整图片大小,使之统一为300,计算图片HSV值,导出到excel表格当中。
import numpy as np
import os
import cv2
import pandas as pd
import xlwt
DATADIR = "C:/Users/p/Desktop/Airbnb_pic" #图片地址
IMG_SIZE = 30