Java视觉智能识别

最新推荐文章于 2024-07-11 07:00:00 发布

xgc_java

最新推荐文章于 2024-07-11 07:00:00 发布

阅读量497

点赞数

文章标签： java ai ocr 图搜索

本文链接：https://blog.csdn.net/qq_41460198/article/details/134360683

版权

JavaVision

🪧 项目起源

JavaVision是一个基于Java开发的全能视觉智能识别项目。该项目起源于对图像处理和人工智能领域的热情，以及对Java作为主要编程语言的坚持。在AI领域，大多数解决方案都是使用Python实现的，因此决定充分利用Java的优势来构建一个功能强大且易于集成的视觉智能识别平台。

JavaVision是完全开源、免费并支持多平台部署视觉智能识别项目
如果该项目对您有帮助，您的star是我不断优化的动力！！！
https://gitee.com/giteeClass/java-vision
https://github.com/javpower/JavaVision

👏 项目特点

JavaVision具有以下突出特点：

框架: SpringBoot
多功能性：JavaVision不仅实现PaddleOCR-V4、YoloV8物体识别、人脸识别、以图搜图等核心功能，还可以轻松扩展到其他领域，如语音识别、动物识别、安防检查等。这使得JavaVision成为一个全面解决多种场景需求的自适应平台。
高性能：JavaVision经过精心优化，具备卓越的性能表现。通过巧妙地结合算法优化和多线程技术，JavaVision能够在短时间内处理大量复杂的图像数据，并快速准确地进行识别和分析。
可靠稳定：Java作为一种成熟而可靠的编程语言，具备出色的稳定性和安全性。JavaVision严格遵循最佳实践和高标准，确保项目的稳定运行，并提供可靠的数据保护和隐私保密。
易于集成：JavaVision提供简洁而强大的API接口，使得与其他系统和平台的集成变得轻松快捷。无论是嵌入到现有应用程序中，还是作为独立的服务进行部署，JavaVision都能够与各种技术栈和框架无缝衔接。
灵活可拓展：JavaVision采用模块化设计，允许用户根据自己的需求进行灵活的定制和扩展。用户可以根据项目需求选择合适的功能模块，也可以通过插件机制添加新的识别算法和特性。

JavaVision旨在为Java开发者提供一个全面的视觉智能识别解决方案，让他们能够以熟悉且喜爱的编程语言构建出先进、可靠且易于集成的AI应用。无论是企业级应用还是个人项目，JavaVision都能助力开发者实现更多可能性

🔝 进阶使用

docker一键部署

docker pull javpower/pdocr:v4.0.1
docker run --name mycontainer -p 6888:6888 javpower/pdocr:v4.0.1

🔝 项目已实现

JNI、DJL方式实现
包括 PaddleOCRV4、YOLOV8、人脸识别、ES以图搜图

一、OCR应用

1、YOLOV8识别物体

接口地址:/yolo8

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK

响应参数:

暂无

响应示例:

{
    "code": 500,
    "success": false,
    "msg": "java.io.FileNotFoundException: /opt/ocr/20231109151816332402394.png (No such file or directory)",
    "data": null,
    "time": "2023-11-09 15:18:16",
    "traceId": null
}

2、YOLOV8识别物体

接口地址:/yolo8/json

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK	Detection

响应参数:

参数名称	类型	schema
label	string
clsId	integer(int32)	integer(int32)
bbox	array
confidence	number(float)	number(float)

响应示例:

[
	{
		"label": "",
		"clsId": 0,
		"bbox": [],
		"confidence": 0
	}
]

3、DJL识别文字

接口地址:/word

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK

响应参数:

暂无

响应示例:

4、DJL识别文字

接口地址:/word/json

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK	WordBlock

响应参数:

参数名称	类型	schema
text	string
charScores	array
boxPoint	array	Point
x	number(double)
y	number(double)

响应示例:

[
	{
		"text": "",
		"charScores": [],
		"boxPoint": [
			{
				"x": 0,
				"y": 0
			}
		]
	}
]

5、反光衣检测

接口地址:/reflective/json

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK

响应参数:

暂无

响应示例:

6、JNI识别文字

接口地址:/ocr

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	请求类型	是否必须	数据类型	schema
param	query	true	OcrParam	OcrParam
openAi-key		false	string
描述词		false	array	string
file	query	true	file

响应状态:

状态码	说明	schema
200	OK

响应参数:

暂无

响应示例:

7、JNI识别文字

接口地址:/ocr/json

请求方式:POST

请求数据类型:multipart/form-data

响应数据类型:*/*

接口描述:

请求参数:

参数名称	参数说明	请求类型	是否必须	数据类型	schema
file		query	true	file

响应状态:

状态码	说明	schema
200	OK	TextBlock

响应参数:

参数名称	类型	schema
boxPoint	array	Point
x	number(double)
y	number(double)
boxScore	number(float)	number(float)
angleIndex	integer(int32)	integer(int32)
angleScore	number(float)	number(float)
angleTime	number(double)	number(double)
text	string
charScores	array
crnnTime	number(double)	number(double)
blockTime	number(double)	number(double)

响应示例:

[
	{
		"boxPoint": [
			{
				"x": 0,
				"y": 0
			}
		],
		"boxScore": 0,
		"angleIndex": 0,
		"angleScore": 0,
		"angleTime": 0,
		"text": "",
		"charScores": [],
		"crnnTime": 0,
		"blockTime": 0
	}
]