破解含语序问题的点击验证码

设计思路

前言

国家企业信用信息公示系统中的验证码是按语序点击汉字,如下图所示:

在这里插入图片描述

即,如果依次点击:‘无’,‘意’,‘中’,‘发’,‘现’,就会通过验证。

本项目的破解思路主要分为以下步骤:

  1. 使用目标探测网络YOLOV2进行汉字定位
  2. 设计算法进行汉字切割
  3. 使用darknet的分类器进行汉字识别
  4. 设计算法进行汉字纠错与语序识别

Github仓库直通车

汉字定位与汉字识别

本项目的汉字定位和汉字识别部分都是基于darknet框架进行训练的。本项目对它们使用的训练网络并没有太高要求,只需懂得如何使用darknet就可以了,关于如何使用darknet框架训练汉字定位模型和汉字识别模型可查阅模型训练文档以及官方文档的YOLO和Train a Classifier部分。那么,下面主要对汉字切割和语序识别进行讲解,最后再对整个破解程序进行讲解。

汉字切割算法

def seg_one_img(img_path, rets):
    img = cv2.imread(img_path)
    hanzi_list = [] # 用于记录每个汉字对应的坐标:key为切割后汉字图片路径,value为中心点坐标
    # 对定位框进行遍历
    for ret in rets:
        per_dict = {
   }
        if ret[1] > 0.5: # 只取置信度大于0.5的定位框
            coordinate = ret[2] # ret[2]为定位器返回的归一化坐标(x,y,w,h)
            center = (int(coordinate[0]*344), int(coordinate[1]*384)) #汉字定位框中心点坐标
            origin = (coordinate[0] - coordinate[2]/2, 
                    coordinate[1] - coordinate[3]/2) # 汉字定位框左上角坐标(归一化)
            # 将定位框向四周均匀扩大2个像素,尽量将整个汉字切割下来。
            x = int(origin[0]*344 - 2)
            x_plus_w =int((origin[0] + coordinate[2])*344 + 4)
            y = int(origin[1]*384 - 2)
            y_plus_h = int((origin[1] + coordinate[3])*384 + 4)
            # 扩大后的定位框可能会出现越界的可能,如一个紧挨着图片边缘的汉字,fix函数调整越界的定位框
            x, y, x_plus_w, y_plus_h = fix(x,y,x_plus_w,y_plus_h)
            # 下面对图片进行切割,并保存
            try:
                hanzi_img = img[y:y_plus_h, x:x_plus_w] # 切割
                normal_img = cv2.resize(hanzi_img, (65,65), 
                        interpolation=cv2.INTER_CUBIC) # 将截取的图片规范化为65*65*3
                path = 'hanzi_img/{
   }_label.jpg.format(timestamp())
                cv2.imwrite(path, normal_img)
                per_dict[path] = center
                hanzi_list.append(per_dict) 
            except:
                print('#'*20)
                print('存在不规则的图片')
    return hanzi_list

# 修正定位框的坐标,如果扩大后的定位框越界则将其设置为边界坐标
def fix(x, y, x_plus_w, y_plus_h ):
    x = 0 if x < 0 else x
    y = 0 if y < 0 else y
    x_plus_w = 384 if x_plus_w > 384 else x_plus_w
    y_plus_h = 344 if y_plus_h > 344 else y_plus_h
    return x, y, x_plus_w, y_plus_h

seg_one_img函数是对一张验证码图片进行汉字切割,切割后的汉字图片保存在当前路径下的hanzi_img文件夹中,并且返回由字典(key为汉字图片路径,value为坐标)组成的列表。需要注意的是,定位接口返回的定位框信息均是归一化信息,需要转换成实际的坐标信息,验证码图片大小信息为:344 × 384 × 3。如(0.25,,75)>> (0.25×344,0.75×384)

算法大体思路:

切割一张图片(图片路径,定位接口返回的定位框信息):

遍历定位框信息,对置信度大于0.5的定位框进行如下操作:

	计算汉字定位框中心坐标和左上角坐标;

	将汉字定位框向四周均匀扩大两个像素;

	对越界的坐标进行修正;

	对汉字进行切割;

定位框向四周扩大两个像素的目的:尽量将整个汉字切割下来。因为经过测试,有些定位框定位正确但是IOU不是很高,即汉字的某一小部分可能在定位框外部。扩大定位框可以更好的用于后面的汉字识别。

语序识别算法

语序识别算法结合了使用结巴分词识别语序使用搜索引擎识别语序两个函数,下面分别对两个函数进行讲解。

使用结巴分词识别语序

本部分使用的是 Python 中文分词词库jieba,关于结巴分词的基础知识请先阅读结巴分词Github文档,下面对使用结巴分词识别语序进行讲解。

# 结巴分词 识别语序
def recog_order_jieba(str):
    l = len(str) # l表示输入字符串个数
    word_list = _permutation(str) # 获得该字符串的所有排列方式
    possible_words = [] # 用来存放语序可能正确的词
    for word in word_list:  # 编列所有排列方式
        seg_list = jieba.lcut(word, cut_all=True ) # 对某一种排列方式使用结巴分词
        index = find_longest(seg_list)  # 寻找结巴分词返回的列表中字符串最长的索引,并返回
        if len(seg_list[index]) == l: # 若最长的字符串与输入的字符串长度相同,则加入可能正确列表
            possible_words.append(seg_list[index])
    if len(possible_words) ==1: # 遍历完后,若可能正确的列表只有一个元素,那么他就是正确的,返回
        return possible_words[0]
    elif len(possible_words) >1: # 若有可能正确列表中若有多个元素,则选取词频高的返回
        return highest_frequency(possible_words)
    else: # 如果可能正确的列表元素为0,则返回0
        return 0 
    
# 获得汉字的所有排列方式
def _permutation(str, r = None): 
    word_list = list(permutations(str, r))
    for i in range(len(word_list)):
        word_list[i] = ''.join(word_list[i])
    return word_list

# 寻找列表中最长的词
def find_longest(list):
    l = 0
    index = 0
    for i,word in enumerate(list):
        if len(word) > l:
            l = len(word)
            index = i 
    return index

# 输入词列表,返回结巴分词内词频最高的词
def highest_frequency(possible_words):
    word_dict = file2dict('dict.txt') 
    possible_dict = {
   }
    for possible_word in possible_words:
        possible_dict[word_dict[possible_word]] = possible_word
    sorted = sortedDictValues(possible_dict)
    print(sortedList)
    return sortedList[-1][1]

# 对输入的字典根据key大小排序
def sortedDictValues(di): 
    return [(k,di[k]) for k in sorted(di.keys())]

# 将文件数据转换为字典
def file2dict(filename):
    with open(filename) as f:
        array_lines = f.readlines()
    returnDict = {
   }
    # 以下三行解析文件数据到列表
    for line in array_lines:
        line = line.strip()
        listFromLine = line.split()
        returnDict[listFromLine[0]] = int(listFromLine[1])
    return returnDict

下面我通过一个具体的实例来讲解算法思路:

输入:‘到马功成’

  1. 获得字符串长度:
l=4
  1. 获得字符串的全排列
 ['到马功成', '到马成功', '到功马成', '到功成马', '到成马功', '到成功马', '马到功成', '马到成功', '马功到成', '马功成到', '马成到功', '马成功到', '功到马成', '功到成马', '功马到成', '功马成到', '功成到马', '功成马到', '成到马功', '成到功马', '成马到功', '成马功到', '成功到马', '成功马到']
  1. 对每一个排列进行结巴分词,并打印其中字符串最长元素的索引
 ['到', '马', '功', '成']
 0
 ['到', '马', '成功']
 2
 ['到', '功', '马', '成']
 0
 ['到', '功', '成', '马']
 0
 ['到', '成', '马', '功']
 0
 ['到', '成功', '马']
 1
 ['马到功成']
 0
 ['马到成功', '成功']
 0
 ['马', '功', '到', '成']
 0
 ['马', '功', '成', '到']
 0
 ['马', '成', '到', '功']
 0
 ['马', '成功', '到']
 1
 ['功', '到', '马', '成']
 0
 ['功', '到', '成', '马']
 0
 ['功', '马', '到', '成']
 0
 ['功', '马', '成', '到']
 0
 ['功', '成', '到', '马']
 0
 ['功', '成', '马', '到']
 0
 ['成', '到', '马', '功']
 0
 ['成', '到', '功', '马']
 0
 ['成', '马', '到', 
  • 10
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 14
    评论
### 回答1: Fortran是一种编程语言,它最初由IBM公司于1950年代开发。Fortran最初的版本是以数学公式为基础的,因此语法结构相对简单,并且注重对数学问题的操作,特别是科学计算领域。 在Fortran中,语句的顺序是非常重要的。如果我们想要改变语句的执行顺序,我们可以使用控制语句来实现。Fortran中最常用的控制语句是IF语句和DO循环。 IF语句用于根据条件的真假选择执行不同的代码块。我们可以使用IF语句来更改Fortran程序中语句的执行顺序。例如,如果我们希望在某个条件成立时跳过某些语句,我们可以使用IF语句来控制程序的执行顺序。 DO循环是Fortran中另一个重要的控制结构,它可以让程序多次执行某个代码块。通过更改DO循环的计数变量,我们可以改变代码的执行顺序。例如,如果我们希望代码块先执行五次,然后再执行其他语句,我们可以使用DO循环来实现。 此外,Fortran还提供了其他一些控制语句,如GOTO语句和SELECT CASE语句,这些语句也可以用于更改代码的执行顺序。 总之,Fortran提供了多种控制语句来更改语句的执行顺序。通过使用这些控制语句,我们可以根据需要灵活地调整代码的执行顺序,从而实现我们想要的功能。 ### 回答2: Fortran是一种编程语言,用于科学计算和数值分析。在Fortran中更改语序指的是改变程序中语句的顺序。 在Fortran中,程序的执行是按照从上到下的顺序逐行进行的。如果需要更改语句的顺序,可以通过交换语句的位置来实现。 例如,假设有以下两行Fortran代码: ``` x = 2.0 y = x + 1.0 ``` 这两行代码的功能是将2.0赋值给变量x,然后计算x+1.0的结果,并将结果赋值给变量y。 如果想要更改语句的顺序,可以将这两行代码进行交换: ``` y = x + 1.0 x = 2.0 ``` 这样,先计算x+1.0的结果,并将结果赋值给y,然后再将2.0赋值给变量x。 通过更改语句的顺序,可以改变程序执行的逻辑和结果。在实际应用中,根据需求进行语句顺序的调整,可以提高程序的效率和可读性。 需要注意的是,更改语句的顺序可能会影响程序的正确性,特别是涉及到变量赋值、条件判断和循环等语句。在进行语句顺序的更改时,应当仔细检查程序的逻辑和功能,确保更改后的程序仍然能够正确执行所需的计算任务。 ### 回答3: Fortran(源自"Formula Translation")是一种编程语言,于20世纪50年代开发出来,用于科学和工程计算。Fortran的版本经过多次改进和更新,不同版本有不同的特性和语法规则。 尽管Fortran具有一定的历史意义和应用领域,但其语法在现代编程语言中被认为相对陈旧和过时。特别是在语序方面,Fortran采用的是传统的“自顶向下”(top-down)的结构,即主程序是从上到下运行的。 然而,随着计算机科技的进步和现代编程语言的发展,许多编程语言开始采用“自底向上”(bottom-up)的结构。这种结构允许程序员从程序末尾开始编写代码,并根据需求逐渐向上构建。这种修改语序的方式更具灵活性和可读性,使得程序员可以更快捷地编写和修改代码。 在Fortran中要改变语序,可以尝试以下方法: 1. 使用模块(module):将程序中的可复用部分抽象出来,封装到一个模块中,然后在主程序中调用。这样可以让程序更加模块化和结构化。 2. 使用子程序(subroutine)或函数(function):将重复或常用的代码块提取出来,封装到子程序或函数中,可以使得主程序更加简洁、清晰,并且便于代码重用。 3. 使用过程抽象(procedure abstraction):将一个过程划分为多个小的、易于理解的步骤,然后按照执行顺序编写代码。这样可以使程序的逻辑更加明确和易懂。 总之,Fortran作为一种编程语言,虽然在语序方面相对固定,但仍然可以通过使用模块、子程序、函数和过程抽象等技术,对其进行修改和改进,以提高程序的可读性、可维护性和灵活性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值