使用Swift实现文字识别验证码的自动化处理

最新推荐文章于 2024-09-14 14:58:05 发布

asfdsgdf

最新推荐文章于 2024-09-14 14:58:05 发布

阅读量635

点赞数 7

文章标签： ssh 服务器运维

本文链接：https://blog.csdn.net/asfdsgdf/article/details/140407930

版权

本文将介绍如何使用Swift语言来实现文字识别验证码的自动化处理。具体步骤包括提取目标文字和背景图文字，计算点击坐标并模拟点击。

一、目标文字识别
首先，我们需要提取目标文字的图片URL并下载。

swift

import Foundation
import Vision
import WebKit

let targetImageUrl = URL(string: "目标图片URL")!

// 下载目标文字图片
let task = URLSession.shared.dataTask(with: targetImageUrl) { data, response, error in
guard let data = data, error == nil else {
print("Failed to download image")
return
}

// 保存图片到文件系统
let targetImagePath = FileManager.default.temporaryDirectory.appendingPathComponent("target_image.png")
try? data.write(to: targetImagePath)

// 使用Vision框架进行OCR识别目标文字
let targetImage = CIImage(contentsOf: targetImagePath)
let requestHandler = VNImageRequestHandler(ciImage: targetImage!, options: [:])

let request = VNRecognizeTextRequest { (request, error) in
guard let observations = request.results as? [VNRecognizedTextObservation] else {
return
}

let targetWords = observations.compactMap { $0.topCandidates(1).first?.string }.joined(separator: " ")
print("Target words: \(targetWords)")
}

request.recognitionLevel = .accurate
try? requestHandler.perform([request])
}

task.resume()
二、背景图文字识别
同样地，先提取背景图片的URL并下载。

swift

let backgroundImgUrl = URL(string: "背景图片URL")!

// 下载背景图片
let backgroundTask = URLSession.shared.dataTask(with: backgroundImgUrl) { data, response, error in
guard let data = data, error == nil else {
print("Failed to download image")
return
}

// 保存图片到文件系统
let backgroundImagePath = FileManager.default.temporaryDirectory.appendingPathComponent("background_image.png")
try? data.write(to: backgroundImagePath)

// 使用Vision框架进行文字坐标识别
let backgroundImage = CIImage(contentsOf: backgroundImagePath)
let requestHandler = VNImageRequestHandler(ciImage: backgroundImage!, options: [:])

let request = VNRecognizeTextRequest { (request, error) in
guard let observations = request.results as? [VNRecognizedTextObservation] else {
return
}

var clickIdentifyResult: [String: CGRect] = [:]
for observation in observations {
if let topCandidate = observation.topCandidates(1).first {
clickIdentifyResult[topCandidate.string] = observation.boundingBox
}
}

print("Click identify result: \(clickIdentifyResult)")
}

request.recognitionLevel = .accurate
try? requestHandler.perform([request])
}

backgroundTask.resume()
三、计算点击坐标并点击
文字全部识别完毕后，只要计算下点击坐标就好了。

swift

func calculateClickCoordinates(targetWords: [String], clickIdentifyResult: [String: CGRect]) -> [CGPoint] {
var clickCoordinates: [CGPoint] = []

for word in targetWords {
if let boundingBox = clickIdentifyResult[word] {
let x = (boundingBox.origin.x + boundingBox.size.width / 2) * UIScreen.main.bounds.width
let y = (boundingBox.origin.y + boundingBox.size.height / 2) * UIScreen.main.bounds.height
clickCoordinates.append(CGPoint(x: x, y: y))
}
}

return clickCoordinates
}

// 示例使用
let targetWords = ["斯", "慷"]
let clickIdentifyResult: [String: CGRect] = ["斯": CGRect(x: 0.1, y: 0.2, width: 0.1, height: 0.1), "慷": CGRect(x: 0.3, y: 0.4, width: 0.1, height: 0.1)]

let clickCoordinates = calculateClickCoordinates(targetWords: targetWords, clickIdentifyResult: clickIdentifyResult)
print("Click coordinates: \(clickCoordinates)")

// 模拟点击操作（这里假设使用WebView进行操作）
let webView = WKWebView(frame: UIScreen.main.bounds)
for coordinate in clickCoordinates {
let js = "document.elementFromPoint(\(coordinate.x), \(coordinate.y)).click()"
webView.evaluateJavaScript(js, completionHandler: nil)
}
本文介绍了如何使用Swift语言实现文字识别验证码的自动化处理，包括提取目标文字和背景图文字，计算点击坐标并模拟点击。通过使用Vision框架进行OCR识别和文字坐标提取，可以较为准确地实现自动化点击操作。