考虑到长度为5和6的门牌号很少,最后只做一个预测门牌号长度<=4的模型
统计不同门牌号长度的数量
json是被处理过的DataFrame,可以看看上一篇blog
5和6长度的门牌号总共就9个,样本分布不均衡,考虑到这是个练习项目,干脆把他们删掉了。
搭建网络
先定义一些训练用的参数
width = 224
height = 112
channel = 1
batch = 64
因为我把图片都grayscale了,所以channel = 1
如果没有这个步骤的话,channel = 3
input_img = keras.layers.Input(shape=(width, height, channel), name='img')
# ----------------------
x = keras.layers.Conv2D(filters=64,kernel_size=3,padding='same',activation='relu')(input_img)
x = keras.layers.BatchNormalization()(x)
x = k