opencv3+python3.5成语填字游戏(二)填字图片汉字提取和识别

   上一篇说的是汉字的分割。今天该实际填字图片的解析了。实际图片如下:


这是一个10*10的方格,所以我们应该先提取100个小方格,然后在提取其中的汉字。

用到的函数主要是python的opencv函数库里的findContours函数,用于找出图片中所有的轮廓层级。

## 轮廓提取
image, contours, hierarchy = cv2.findContours(dilated,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

1. 提取100个方格的代码;

for i in range(len(hierarchy[0])):
    if hierarchy[0][i][3] == 0:
        boxes.append(hierarchy[0][i])
        indexs.append(i)
2. 提取方格中的数字,还有将白色空白方格填'1',黄色方格填“0”,主要是为了形成初始填字矩阵,便于后续的解密算法的进行。代码:

#提取方格中的汉字
for j in range(len(boxes)):
    if boxes[j][2] == -1: #方格中空白
        x,y,w,h = cv2.boundingRect(contours[indexs[j]])
        number_boxes.append([x,y,w,h])
        #cv2.rectangle(img,(x-1,y-1),(x+w-10,y+h-10),(0,0,255),1)
        centerColor = img[round((2*y+h)/2),round((2*x+w)/2)]
        #print(centerColor)
        if(centerColor[0] > 200): #区分出黄色格与白色格,黄色(0,255,255)白色(255,255,255)
            #print(y/box_h,round(y/box_h),x/box_w,round(x/box_w))
            miyu[round(y/box_h)][round(x/box_w)] = "1" #白色空格填‘1’
    elif boxes[j][2] != -1: #方格中有字
        x,y,w,h = cv2.boundingRect(contours[boxes[j][2]])
        #print(x,y,w,h)

        number_boxes.append([x,y,w,h])
        #cv2.rectangle(img,(x-1,y-1),(x+w+1,y+h+1),(0,255,0),1)
        #img = cv2.drawContours(img, contours, boxes[j][2], (0,255,0), 1)
        ## 对提取的数字进行处理
        number_roi = gray[y:y+h, x:x+w]
        ## 统一大小
        resized_roi=cv2.resize(number_roi,(30,30))
        thresh1 = cv2.adaptiveThreshold(resized_roi,255,1,1,11,2) 
        ## 归一化像素值
        normalized_roi = thresh1/255.  
        '''
        cv2.imshow("thresh1", thresh1)
        cv2.waitKey(0)
        cv2.destroyAllWindows()
        '''
        ## 展开成一行让knn识别
        sample1 = normalized_roi.reshape((1,len(normalized_roi)*len(normalized_roi[0])))
        sample1 = np.array(sample1,np.float32)
        
        ## knn识别
        retval, results, neigh_resp, dists = model.findNearest(sample1, 1)        
        number = int(results.ravel()[0])
        #print(number)
        #numbers.append(number)
     
        # 第一个参数为打印的坐标,第二个为打印的文本,第三个为字体颜色,第四个为字体
        draw.text((x+(w/2)+10,y-10), str(hanzis[number-1]), (0, 0, 255), font=font) 
        
        ## 求在矩阵中的位置
        miyu[round(y/box_h)][round(x/box_w)] = str(hanzis[number-1])
3.图片中汉字的识别,使用的是knn算法,代码:

#创建knn对象并训练样本
model = cv2.ml.KNearest_create()
model.train(samples,cv2.ml.ROW_SAMPLE,labels)
  识别函数代码:
## knn识别
retval, results, neigh_resp, dists = model.findNearest(sample1, 1)   #预测测试样本     
number = int(results.ravel()[0]) #得出预测样本的样本标记
   knn主要是监督学习算法,先对已有数据样本训练,然后根据已有样本预测测试样本,准确度依赖于原始样本的准确度,并且不能保证100%的准确率。

 识别结果:

               

   此准确度是在多次调试之后才完全正确的,包括对测试图片本身大小像素调整,还有训练样本图片的调整,期间试了很多次,一直识别不对,所以识别准确度只针对本项目中的图片和样本。

源代码:https://github.com/mayue801/crossword-puzzle--idiom


   

经典填字游戏:在3*3个方格的方阵中要填入数1到N(N>=10)内的某9个数,每个方格填一个整数,使得所有相邻两个方格内的两个整数之和为质数。试求出所有满足这个要求的各种数填法。 //我们可以通过改变N的值来求不同数范围的质数数组,如果超出整型的范围,还需要改变数据类型。 //f[i]来记录数i是否使用过, //T[i]用来记录下一个可以插在数i后面的与其和为质数的数在F[i][]中的位置。 //用F[i][j]来存储按数从小到大的顺序得出的与数i和为质数的第j个数, //例如:F[1][2]存储的是与数1的和为质数的第个数,我们可以通过查询数组F[][]的第一行找出第个不为0 //值,然后将当前数组单元的列号存储到F[1][2]中,即F[1][2] = 4。 //算法思想是通过查询维数组F[][],来确定下一个可以插入数组num[]的未使用过的数,并记录该数位于数组F[][]的位置, //以便回溯时寻找下一个符合要求的数。如果不存在这样的未使用的数,则需要回溯到上一个已插入num[]的数, //寻找下一个可以插在该数后面的未使用过的数进行插入,如果所有的数都已经插入到num[]中, //如是则打印结果。当所有数都已插入num[]中,开始 //进行回溯,重复上述操作,寻找其他符合要求的序列。 //这里面有一个关键在于处理位于num数组右下角四个格子的数时,不光需要判断与前一个数i的关系,还需要判断其头顶上的元素之和是否为素数。 //程序中有一大段代码是处理i和j的。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值