发现做深度学习的图像推理的时候,经常会需要对图像做scale操作,这里总结几种常用的方法。
1.FFMPEG方法
ffmpeg -i dog.jpg -vf scale=416:416 output_416x416.png
ffmpeg -i dog.jpg -vf scale=416:416 output_416x416.jpg
或者生成YUV裸数据的时候,顺便做scale
ffmpeg -i beauty.jpeg -pix_fmt nv12 -s 416x416 beauty.nv12.yuv
ffplay -pix_fmt nv12 -f rawvideo -video_size 416x416 ./beauty.nv12.yuv
2.python方法:
from PIL import Image
import os
import sys
import cv2
if __name__ == "__main__":
if len(sys.argv) < 1:
print('need more than 1 arguments')
sys.exit(-1)
filename = sys.argv[1]
file_name, file_extension = os.path.splitext(filename)
w = 416
h = 416
if len(sys.argv) >= 3:
w = int(sys.argv[2])
h = int(sys.argv[3])
img = Image.open(filename)
img2 = img.resize((w, h), Image.ANTIALIAS)
img2.save('%s_%d_%d%s' % (file_name, w, h, file_extension))
输入python resize.py dog.jpg
3.Windows画图程序
打卡图片,点击工具栏中的重新调整大小或者快捷键ctrl+w
取消选中“保持纵横比", 选中”像素“单选框,然后再下面两栏中填写预期图片的长和宽,接收后点确定。
点击确定,图像已经转换为416*416,之后保存。
重新用图片查看工具打开,可以看到分辨率已经变为416*416.
4.Convert转
安装convert
sudo apt-get install imagemagick
转换命令,注意加!是强制按照输入的长宽进行转换,如果不加!的话,会按照固定的长宽比进行缩放。
convert -resize 416x416! dog.jpg d.jpg
5.Python CPP版
#include <opencv2/opencv.hpp>
#include <iostream>
#include <vector>
using namespace std;
using namespace cv;
int main(int argc, char **argv)
{
Mat img = imread("godfather.jpeg");
if(img.empty())
{
cout <<"please confirm the name of pic is right!" <<endl;
return -1;
}
Size dsize = Size(416, 416);
Mat img2 = Mat(dsize, CV_8UC3);
resize(img, img2, dsize);
imwrite("./scale.jpg",img2);
waitKey(0);
return 0;
}