导语
又到了愉快地周末,应某好友的要求,本周来补一期视频转字符动画相关的内容,核心主题是将蔡徐坤打球的视频转成字符动画。我也不知道为什么,真的不知道,真的真的不知道为什么。嗯,重要的话说三遍。说干就干,让我们愉快地开始吧~
开发工具
Python版本:3.6.4
相关模块:
pillow模块;
pyprind模块;
numpy模块;
argparse模块;
opencv-python模块;
以及一些Python自带的模块。
其他:
ffmpeg。
先睹为快(注:关注微信公众号“Charles的皮卡丘”,公众号内回复‘视频转字符动画’获取本文所有相关文件。)https://www.zhihu.com/video/1100498111268474880
原理简介
原理其实依旧很简单,总代码量不足百行。首先是视频转字符动画,我们提取视频的所有帧,将每帧图片resize到固定尺寸,使得resize后的图片每个像素点对应原图的一个像素块,例如下图所示:
然后新建一个和原图同样大小的空白图,将resize后的图片每个像素点的信息用一个特定的字符表示在空白图对应的像素块上(每个点的字符由该点的像素值决定)。处理完所有帧后,将所有帧合成为新的视频即可。具体而言,代码实现如下:
def video2charVideo(videofile):
frames = []
cap = cv2.VideoCapture(videofile)
fps = cap.get(cv2.CAP_PROP_FPS)
font = ImageFont.load_default().font
font_w, font_h = font.getsize(CHARS[1])
font_h += 2
print('[INFO]: Convert video to charFrames...')
for i in pyprind.prog_bar(range(int(cap.get(7)))):
frame = cap.read()[1]
frame = Image.fromarray(cv2.cvtColor(frame, cv2.COLOR_BGR2RGB))
frame = frame.resize((font_w*frame.width//font_w, font_h*frame.height//font_h), Image.NEAREST)
width_ori = frame.width
height_ori = frame.height
frame = frame.resize((width_ori//font_w, height_ori//font_h), Image.NEAREST)
width = frame.width
height = frame.height
txt = ''
colors = []
for i in range(height):
for j in range(width):
pixel = frame.getpixel((j, i))
colors.append(pixel[:3])
txt += rgb2Char(*pixel)
frame_new = Image.new('RGB', (width_ori, height_ori), (255, 255, 255))
draw = ImageDraw.Draw(frame_new)
x = y = 0
for j in range(len(txt)):
if x == width_ori:
x = 0
y += font_h
draw.text((x, y), txt[j], font=font, fill=colors[j])
x += font_w
frames.append(frame_new)
cap.release()
fourcc = cv2.VideoWriter_fourcc(*"MJPG")
v_writer = cv2.VideoWriter('cache.avi', fourcc, fps, frames[0].size)
print('[INFO]: Convert charFrames to charVideo...')
for i in pyprind.prog_bar(range(len(frames))):
frame = frames[i]
frame = cv2.cvtColor(np.asarray(frame), cv2.COLOR_RGB2BGR)
v_writer.write(frame)
v_writer.release()
return True
然后利用ffmpeg提取原视频的声效,源代码如下所示:
def extractMP3(videofile):
subprocess.call('ffmpeg -i %s -f mp3 cache.mp3' % videofile, shell=True)
return True
最后利用ffmpeg将生成的字符动画和原视频音频信息合并,源代码如下所示:
'''合并视频和音频'''
def combineVideoMP3(videopath='cache.avi', mp3path='cache.mp3', remove=True):
subprocess.call('ffmpeg -i %s -i %s -strict -2 -f mp4 %s' % (videopath, mp3path, 'results.mp4'), shell=True)
if remove:
os.remove(videopath)
os.remove(mp3path)
That's all。