Calvin.AIAS-CSDN博客

原创人工智能：图片一键高清，照片一键修复，头像一键高清（Java SDK及web应用）

这种技术可以自动识别图像中的人脸，并进行修复和还原，从而使图像更加完整、清晰和自然。目前，有多种图像超分辨方法可供选择，包括基于插值的方法、基于边缘的方法、基于学习的方法等。这些方法使用深度学习模型，如卷积神经网络（CNN）或生成对抗网络（GAN），通过训练大量的图像样本来学习图像的高频细节和结构，从而实现图像超分辨。它可以改善图像的视觉质量，提供更多细节和清晰度，有助于改善图像分析、图像识别和人机交互等任务的准确性和效果。在图像超分辨的任务中，我们希望通过增加图像的细节和清晰度来提高图像的质量。

2023-12-23 22:14:35 584 1

原创人工智能：一键抠图（Java SDK及web应用）

一键抠图的原理通常基于计算机视觉和机器学习技术。它使用深度神经网络模型，通过训练大量的图像样本，学习如何识别和分离前景对象和背景。这些模型能够理解图像中的像素信息和上下文，并根据学习到的知识进行像素级别的分割。一键抠图是一种图像处理技术，旨在自动将图像中的前景对象从背景中分离出来。它可以帮助用户快速、准确地实现抠图效果，无需手动绘制边界或进行复杂的图像编辑操作。

2023-12-18 19:31:17 896

原创人工智能：支持中英互译等202种语言的互相翻译（Java SDK及web应用）

人工智能 Java SDK：支持中英互译等202种语言的互相翻译。

2023-11-17 09:03:59 443

原创大模型桌面App（离线版）- 支持chatglm2，baichuan2，llama2，alpaca2等

选择模型，并运行创建新的对话，与模型聊天点击前往网站首页。

2023-10-08 14:06:20 317

原创 AI桌面工具系列 - 文字识别，以图搜图，图片放大等

简单易用的AI桌面工具系列网站首页 1. OCR 文字识别app图片文字识别图片表格识别（TODO） 2. 图像搜索app图片管理：选择图片目录，提取图片特征值以图搜图：用图片搜索图片以文搜图：根据文字描述搜索图片（基于图片的语义理解） 3. 图片无损放大app单张图片分辨率放大批量图片分辨率放大网站首页

2023-09-29 22:23:27 792

原创人工智能AI系列 - java WebUI - 文本向量搜索

输入地址： http://localhost:8090上传CSV数据文件1). 点击上传按钮上传CSV文件.测试数据2). 点击特征提取按钮.等待CSV文件解析，特征提取，特征存入向量引擎。通过console可以看到进度信息。文本搜索输入文字，点击查询，可以看到返回的清单，根据相似度排序。swagger接口文档点击前往网站首页 http://aias.top/

2023-09-05 15:38:41 210

原创人工智能AI系列 - java WebUI - OCR 自定义模板识别(支持表格识别)

文字识别（OCR）目前在多个行业中得到了广泛应用，比如金融行业的单据识别输入，餐饮行业中的发票识别，交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。OCR（文字识别）是目前常用的一种AI能力。一般OCR的识别结果是一种按行识别的结构化输出，能够给出一行文字的检测框坐标及文字内容。但是我们更想要的是带有字段定义的结构化输出，由于表单还活着卡证的多样性，全都预定义好是不现实的。

2023-09-05 15:36:52 441

原创人工智能AI系列 - java WebUI - 以图搜图

首页1). 支持图片拖拽，粘贴搜索.2). 适配PC，android，ios浏览器.图片列表页1). 支持图片拖拽，粘贴搜索.2). 图片排版自适应.3). 图片列表下拉自动加载.登录用户管理角色管理运维管理图片上传1). 支持zip压缩包上传.2). 支持服务器端文件夹上传（大量图片上传使用，比如几十万张图片入库）.3). 支持客户端文件夹上传.图像搜索点击前往网站首页 http://aias.top/

2023-09-04 09:50:26 184

原创人工智能AI系列 - java WebUI - 人像搜索

登录用户管理角色管理运维管理图片上传1). 支持zip压缩包上传.2). 支持服务器端文件夹上传（大量图片上传使用，比如几十万张图片入库）.3). 支持客户端文件夹上传.人像搜索点击前往网站首页 http://aias.top/

2023-09-04 09:49:45 145

原创人工智能AI系列 - java WebUI - 语音识别

输入地址： http://localhost:8090。

2023-09-04 09:49:00 185

原创人工智能AI系列 - java SDK - stable diffusion 图像生成工具箱

点击前往网站首页 http://aias.top/ 图像生成工具箱 SDK1. 文生图：输入提示词，生成图片2. 图生图：根据图片及提示词生成图片3. Lora 图像生成文生图测试提示词 prompt： a photo of an astronaut riding a horse on mars生成图片效果： 4. Controlnet 图像生成4.1. Canny 边缘检测Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓，常用于生成线稿。对应Con

2023-09-04 09:47:59 339

原创人工智能AI系列 - java SDK - stable diffusion 图像生成预处理工具箱

点击前往网站首页 http://aias.top/ 图像生成预处理工具箱 SDK1. Canny 边缘检测Canny 边缘检测预处理器可很好识别出图像内各对象的边缘轮廓，常用于生成线稿。对应ControlNet模型： control_canny 2. MLSD 线条检测MLSD 线条检测用于生成房间、直线条的建筑场景效果比较好。对应ControlNet模型： control_mlsd 3. Scribble 涂鸦不用自己画，图片自动生成类似涂鸦效果的草图线条。

2023-09-04 09:47:15 294

原创人工智能AI系列 - java SDK - webrtc语音活动检测(Voice Activity Detection,VAD)

语音活动检测可以运行在4种不同的模式。模式0非常严格，这意味着当VAD预测为语音时，音频片段是语音的概率更高。模式3非常激进，这意味着当VAD预测为语音时，音频是语音的概率较低。目的是从声音信号流里识别和消除长时间的静音期，静音抑制可以节省宝贵的带宽资源，可以有利于减少用户感觉到的端到端的时延。VAD引擎需要8、16、32或48 KHz的采样率的单声道、16位PCM音频作为输入。输入应该是10、20或30毫秒的音频片段。当音频输入为16 KHz时，输入数组的长度应为160、320或480。

2023-09-04 09:45:35 824

原创人工智能AI系列 - java SDK - AI语音活动检测(Voice Activity Detection,VAD)

语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期，静音抑制可以节省宝贵的带宽资源，可以有利于减少用户感觉到的端到端的时延。单个CPU线程可以在不到1ms的时间内处理一个音频块（30+ ms）。Silero VAD在包括100多种语言的大型语料库上进行训练，并且在具有各种背景噪声和质量水平的不同领域的音频上表现良好。Silero VAD支持8000 Hz和16000 Hz的采样率。

2023-09-04 09:45:02 490

原创人工智能AI系列 - java SDK - 句向量SDK【支持中文】

模型通过千万级 (2200w+) 的中文句对数据集进行训练。模型支持中英双语的同质文本相似度计算，异质文本检索等功能。模型是文本嵌入模型，可以将自然语言转换成稠密的向量。使用场景主要是中文，少量英文的情况。

2023-09-04 09:13:17 185

原创人工智能AI系列 - java SDK - 句向量SDK【支持100种语言】

将不定长的句子用定长的向量表示，为NLP下游任务提供服务。句向量是指将语句映射至固定维度的实数向量。

2023-09-04 09:12:25 114

原创人工智能AI系列 - java SDK - 图像&文本的跨模态相似性比对 SDK【支持40种语言】

OpenAI 发布了两个新的神经网络：CLIP 和 DALL·E。它们将 NLP（自然语言识别）与图像识别结合在一起，对日常生活中的图像和语言有了更好的理解。之前都是用文字搜文字，图片搜图片，现在通过CLIP这个模型，可是实现文字搜图片，图片搜文字。其实现思路就是将图片跟文本映射到同一个向量空间。如此，就可以实现图片跟文本的跨模态相似性比对检索。特征向量空间（由图片 & 文本组成）

2023-09-03 23:02:55 202

原创人工智能AI系列 - java SDK - 图像超分辨(4倍)

人工智能图像超分辨技术可以应用于许多领域，例如医学影像、安防监控和卫星图像等。在医学影像领域，高分辨率图像可以帮助医生精确诊断疾病，提高治疗效果。在卫星图像领域，高分辨率图像可以为地球科学、农业和城市规划等提供更多的信息，从而帮助人们更好地了解和保护地球。这项技术可以提高图像的质量、增强图像的细节，减少图像失真，从而帮助用户获得更清晰、更真实的图像。通常情况下，人工智能图像超分辨技术可以将低分辨率图像转换为高分辨率图像，同时保持图像的清晰度和真实度。提升图片4倍分辨率。

2023-09-03 23:01:51 193

原创人工智能AI系列 - java SDK - 图片特征提取

运行例子 - FeatureExtractionExample。运行例子 - FeatureComparisonExample。提取图片特征值，并支持图片1:1特征比对，给出置信度。测试图片: 左右特征对比。

2023-09-03 23:01:12 220

原创人工智能AI系列 - java 版文字识别（OCR）工具箱 - 文本图像超分辨

例如，在数字阅读和数字化文献方面，通过超分辨技术可以提高文本的可读性和清晰度，从而提高文献的价值。在安防监控方面，超分辨技术可以帮助提高图像的清晰度，从而提高监控的效果。总的来说，人工智能文本图像超分辨技术在许多领域都有着广泛的应用前景，它将继续发挥重要的作用，推动图像处理技术的发展。相比之下，人工智能文本图像超分辨技术使用深度学习和神经网络等技术，可以更准确地重建图像细节，从而提高图像的清晰度和分辨率。交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。

2023-09-03 23:00:13 219

原创人工智能AI系列 - java 版文字识别（OCR）工具箱 - 文字识别 SDK

文字识别（OCR）目前在多个行业中得到了广泛应用，比如金融行业的单据识别输入，餐饮行业中的发票识别，交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。CPU：2.3 GHz 四核 Intel Core i5。图片检测框较多时，多线程可以显著提升识别速度。OCR（文字识别）是目前常用的一种AI能力。同样图片单线程运行时间：1172 ms。多线程运行时间：707 ms。

2023-09-03 22:55:29 252

原创人工智能AI系列 - java 版文字识别（OCR）工具箱 - 版面分析

文字识别（OCR）目前在多个行业中得到了广泛应用，比如金融行业的单据识别输入，餐饮行业中的发票识别，交通领域的车票识别，企业中各种表单识别，以及日常工作生活中常用的身份证，驾驶证，护照识别等等。可以用于配合文字识别，表格识别的流水线处理使用。OCR（文字识别）是目前常用的一种AI能力。

2023-09-03 22:54:10 273

原创人工智能AI系列 - 人脸提升分辨率 java SDK

人工智能图片人脸修复是一种应用计算机视觉技术和深度学习算法进行图像修复的方法。这种技术可以自动识别图像中的人脸，并进行修复和还原，从而使图像更加完整、清晰和自然。它可以处理各种类型的图像，包括黑白照片、彩色照片和视频帧等。相较于传统的图像修复方法，人工智能图片人脸修复更加高效和准确。它可以快速地修复照片中的缺陷，例如面部皮肤瑕疵、眼睛或嘴巴的闭合问题等，使其看起来更加美观自然。这种技术在图像处理、医学影像、电影制作等领域都有着广泛的应用前景，并且随着人工智能技术的不断发展，其应用领域也会越来越广泛。

2023-09-03 22:50:12 95

原创人工智能AI系列 - java 版的图片人脸修复 SDK

人工智能图片人脸修复是一种应用计算机视觉技术和深度学习算法进行图像修复的方法。这种技术可以自动识别图像中的人脸，并进行修复和还原，从而使图像更加完整、清晰和自然。相较于传统的图像修复方法，人工智能图片人脸修复更加高效和准确。它可以快速地修复照片中的缺陷，例如面部皮肤瑕疵、眼睛或嘴巴的闭合问题等，使其看起来更加美观自然。这种技术在图像处理、医学影像、电影制作等领域都有着广泛的应用前景，并且随着人工智能技术的不断发展，其应用领域也会越来越广泛。自动检测人脸及关键地，然后抠图，然后根据人脸关键点转正对齐。

2023-09-03 22:48:52 261

原创人工智能AI系列 - java 版的人脸特征提取与比对SDK

人工智能人脸特征提取是一种复杂而重要的计算机技术，其主要目的是通过对人脸图像进行深度分析和处理，提取出具有代表性的特征信息，以用于实现人脸识别、人脸比对、人脸验证等应用。人脸识别完整的pipeline：人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对。人脸识别完整的pipeline：人脸检测(含人脸关键点) --> 人脸对齐 --> 人脸特征提取 --> 人脸比对。提取特征计算相似度。人脸识别涉及的关键技术包含：人脸检测，人脸关键点，人脸特征提取，人脸比对，人脸对齐。

2023-09-03 22:45:45 329

原创人工智能AI系列 - java 版的人脸对齐 SDK

在对齐过程中，算法会根据人脸的特征点（如眼睛、鼻子、嘴巴等）进行定位和标记，然后根据这些特征点的位置和关系进行调整，使得人脸的位置和大小达到一定的标准。因为在人脸识别过程中，不同的人脸可能存在着不同的姿态、表情和光照等情况，而人脸对齐技术可以将这些差异减少，从而更好地进行识别和分析。其目的是将人脸图像中的人脸调整到一个标准的位置和大小，以便于后续的人脸识别、表情识别、面部分析等任务的进行。人脸识别涉及的关键技术包含：人脸检测，人脸关键点，人脸特征提取，人脸比对，人脸对齐。

2023-09-03 22:45:12 180

原创人工智能AI系列 - java 版人脸检测(含5个人脸关键点)SDK

在计算机视觉中，人脸检测是一个基础问题，它是许多高级应用程序的先决条件，例如人脸识别、表情识别、人脸跟踪和人脸合成。人脸检测算法通过分析图像、视频中的像素值，来确定图像中是否存在人脸，如果存在，就可以定位人脸的位置和大小。总之，人脸检测算法是一种非常重要的计算机视觉技术，它可以在许多不同的应用程序中发挥作用，使得我们的生活更加智能、便捷和安全。人脸识别涉及的关键技术包含：人脸检测，人脸关键点，人脸特征提取，人脸比对，人脸对齐。本文的例子给出了人脸检测(含5个人脸关键点)的参考实现。

2023-09-03 22:44:26 340

原创人工智能AI系列 - java 版的stable diffusion 图像生成

java 版的stable diffusion 图像生成

2023-03-11 10:07:02 2945 1

原创 Java版的NumPy IO - npy,npz保存与读取

NDArray IO1. 将数组保存到以 .npy 为扩展名的文件PythonNumpy 可以读写磁盘上的文本数据或二进制数据。NumPy 为 ndarray 对象引入了一个简单的文件格式：npy。npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。常用的 IO 函数有：load() 和 save() 函数是读写文件数组数据的两个主要函数，默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。savez() 函数用于将多个数组写入文件

2022-03-21 09:38:38 2618

原创 Java版的NumPy - NDArray 矩阵

NDArray 矩阵1. 转置矩阵PythonNumPy 提供了多种排序的方法。这些排序函数实现不同的排序算法，每个排序算法的特征在于执行速度，最坏情况性能，所需的工作空间和算法的稳定性。下表显示了三种排序算法的比较。import numpy as np a = np.arange(12).reshape(3,4) print ('原数组：')print (a)print ('\n') print ('转置数组：')print (a.T)# 输出结果如下：原数组：[

2022-03-20 17:39:55 1521

原创 Java版的NumPy - NDArray 排序、条件刷选函数

NDArray 排序、条件刷选函数1. 数组的排序 - numpy.sort()PythonNumPy 提供了多种排序的方法。这些排序函数实现不同的排序算法，每个排序算法的特征在于执行速度，最坏情况性能，所需的工作空间和算法的稳定性。下表显示了三种排序算法的比较。import numpy as np a = np.array([[3,7],[9,1]]) print ('我们的数组是：')print (a)print ('\n')print ('调用 sort() 函数：'

2022-03-20 17:38:50 698

原创 Java版的NumPy - NDArray 统计函数

NDArray 统计函数1. 最小元素，最大元素PythonNumPy 提供了很多统计函数，用于从数组中查找最小元素，最大元素，百分位标准差和方差等。函数说明如下：numpy.amin() 和 numpy.amax()numpy.amin() 用于计算数组中的元素沿指定轴的最小值。numpy.amax() 用于计算数组中的元素沿指定轴的最大值。import numpy as np a = np.array([[3,7,5],[8,4,3],[2,4,9]]) print ('我

2022-03-20 17:37:35 1512

原创 Java版的NumPy - NDArray 算术函数

NDArray 算术函数1. 加减乘除算术函数包含简单的加减乘除: add()，subtract()，multiply() 和 divide()。需要注意的是数组必须具有相同的形状或符合数组广播规则。Pythonimport numpy as np a = np.arange(9, dtype = np.float_).reshape(3,3) print ('第一个数组：')print (a)print ('\n')print ('第二个数组：')b = np.array(

2022-03-20 17:36:29 272

原创 Java版的NumPy - NDArray 数学函数

NDArray 数学函数NDArray包含大量的各种数学运算的函数，包括三角函数，算术运算的函数，复数处理函数等。1.三角函数NDArray 提供了标准的三角函数：sin()、cos()、tan()。Pythonimport numpy as np a = np.array([0,30,45,60,90])print ('不同角度的正弦值：')# 通过乘 pi/180 转化为弧度 print (np.sin(a*np.pi/180))print ('\n')print ('数组

2022-03-20 17:35:20 1256

原创 Java版的NumPy - NDArray 广播(Broadcast)

NDArray 广播(Broadcast)广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式，对数组的算术运算通常在相应的元素上进行。如果两个数组 a 和 b 形状相同，即满足 a.shape == b.shape，那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同，且各维度的长度相同。1.两个数组 a 和 b 形状相同Pythonimport numpy as np a = np.array([1,2,3,4]) b =

2022-03-20 17:34:02 253

原创 Java版的NumPy - 索引切片 - 通过索引或切片来访问或赋值ndarray对象的内容

Ndarray 索引切片 - 通过索引或切片来访问ndarray对象的内容ndarray对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样。ndarray 数组可以基于 0 - n 的下标进行索引，切片对象可以通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。1. 冒号分隔切片参数 start:stop:step 来进行切片Pythonimport numpy as np a = np.a

2022-03-20 17:32:27 611 1

原创 Java版的NumPy - NDarray数组

Ndarray数组本节我们将来了解数组的一些基本属性。在 NumPy中，每一个线性的数组称为是一个轴（axis），也就是维度（dimensions）。比如说，二维数组相当于是两个一维数组，其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴（axis），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量就是数组的维数。1. 数组的维数Pythonimport numpy as np a = np.arange(24) print (a.nd

2022-03-20 17:31:26 4610 1

原创 Java版的NumPy - 创建Ndarray 对象

Ndarray 对象NumPy 最重要的一个特点是其 N 维数组对象 ndarray，它是一系列同类型数据的集合，以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。NDManager是DJL中的一个class可以帮助管理NDArray的内存使用。通过创建NDManager，可以及时的对内存进行清理。当这个block里的任务运行完成时，内部产生的NDArray都会被清理掉。这个设计保证了我们在大规模使

2022-03-20 17:29:37 1169

原创 Java版的NumPy - NDArray 介绍

NDArray 的背景介绍在Python的世界，调用NDArray的标准包叫做NumPy。为了给Java开发者创造同一种工具，亚马逊云服务开源了DJL，一个基于Java的深度学习库。尽管它包含了深度学习模块，但是它最核心的NDArray库可以被用作NumPy的java替代工具库。同时它具备优良的可扩展性，全平台支持，以及强大的后端引擎支持 (TensorFlow, PaddlePaddle, PyTorch, Apache MXNet等)。无论是CPU还是GPU, PC还是安卓，DJL都可以

2022-03-20 17:28:09 7922

原创人工智能AI - 以图搜图产品

网站首页以图搜图产品主要特性底层使用特征向量相似度搜索单台服务器十亿级数据的毫秒级搜索近实时搜索，支持分布式部署随时对数据进行插入、删除、搜索、更新等操作支持在线用户管理与服务器性能监控，支持限制单用户登录系统功能搜索管理：提供通用图像搜索，人像搜索，图像信息查看存储管理：提供图像压缩包(zip格式)上传，人像特征提取，通用特征提取用户管理：提供用户的相关配置，新增用户后，默认密码为123456角色管理：对权限与菜单进行分配，可根据部门设置角色的数据权限菜...

2022-03-12 16:58:04 2827 2

空空如也

空空如也