
图像处理
文章平均质量分 58
幸福清风
专注python语言
展开
-
【Liblib】基于LiblibAI自定义模型,总结一下Python开发步骤
Liblib AI(哩布哩布 AI)是一个集成了先进人工智能技术和用户友好设计的 AI 图像创作绘画平台和模型分享社区。Liblib是个图像ai平台,有根据文字生成图片,修复图片,图片重绘等多种功能。API试用计划:登录后可领取500试用积分,限时7天免费测试体验。原创 2025-05-14 18:29:04 · 1315 阅读 · 0 评论 -
【OCR】总结目前流行的主要的OCR工具
扫描件上的污渍、老照片的黄斑、手机翻拍的摩尔纹,这些噪声如同数字时代的“文字迷彩服”。从Tesseract的开源先驱到Gemini 2.5 Pro的多模态突破,OCR技术始终在“识别率-速度-成本”的三角中寻找平衡。从楷书的连笔到黑体的刻板,从古籍的竖排繁体到现代文档的多栏混排,文字形态的复杂性远超想象。当遇到“甲乙丙方”等上下文依赖的表述,或“O/1/I”等形似字符时,再先进的算法也可能误判。正如数字世界的翻译官,OCR的价值不在于完美,而在于让沉默的文字重新开口说话。原创 2025-04-09 13:47:14 · 953 阅读 · 0 评论 -
【OCR】总结github上开源 OCR 工具:让文字识别更简单
在数字化的时代,光学字符识别(OCR)技术成为了我们处理文档、图像文字信息的得力助手。它能够将图像中的文字信息转换为可编辑和可处理的文本数据,极大地提高了信息处理的效率。今天,我要给大家介绍一些优秀的开源 OCR 工具,它们在不同的场景下各显神通,让我们一起来看看它们的强大之处吧!原创 2025-03-19 14:00:46 · 2847 阅读 · 0 评论 -
【PDF识别】总结PDF文本内容与表格提取的方法
pdfminer是一个高度可定制的PDF处理库,适用于需要深度自定义提取逻辑的场景。在PDF文本与表格提取的征程中,我们遇到了各种挑战,也探索了多种解决方案。简单文本提取:PyPDF2和fitz是不错的选择,简单易用,适合初学者快速上手。表格与精确文本提取:pdfplumber在处理表格方面表现出色,能够满足对文本和表格精确提取的需求。复杂PDF处理:pdfminer的灵活性使其能够应对复杂的PDF结构,适合需要深度自定义提取逻辑的场景。扫描PDF处理。原创 2025-03-18 14:26:36 · 1480 阅读 · 0 评论 -
【OCR】基于深度学习的验证码识别模型训练的方法
数据预处理:将验证码文本标签转换为独热编码向量。:将独热编码向量转换回文本标签。:从指定目录加载图片数据,并将RGB图片转换为灰度图片,同时从文件名中提取标签。模型定义:定义了一个卷积神经网络(CNN)模型,用于定长验证码的识别。模型包含多层卷积、池化和全连接层,最终输出验证码的预测结果。训练过程train函数:加载训练和验证数据,初始化模型,使用回调函数(如)监控训练过程,并保存最佳模型。预测功能Predictor类:加载训练好的模型,提供单张图片或远程图片的预测功能。原创 2025-02-18 09:49:24 · 1008 阅读 · 0 评论 -
【OCR】总结Python中图片与pdf识别文本的方法
性能强大,适合复杂场景的文字识别。:封装了多个 OCR 引擎(如 Tesseract、Cuneiform 等),提供了统一的接口。:Tesseract 的 Python 封装,支持多种语言,使用简单,适合传统 OCR 任务。注意:根据你的具体需求(如语言支持、应用场景、性能要求等),可以选择最适合的 OCR 库。:易于使用,支持多种语言(包括中文、英文等),基于深度学习技术,适合初学者和快速集成。:专注于文档分析和表格识别,能够提取文档中的结构化信息,适合处理复杂布局的文档。原创 2025-02-14 16:41:06 · 3000 阅读 · 0 评论 -
【Python】基于Tesseract OCR的文本识别方法及代码示例
什么是 OCROCR,即,是光学字符识别的简称。它是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简言之,OCR技术可以将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。OCR技术基于图像处理和模型识别技术,其应用场景非常广泛,包括文档数字化、数据提取、自动翻译、安全监控、智能客服等,还可以应用于医疗、金融、教育等领域。衡量一个OCR。原创 2025-02-13 17:02:28 · 1826 阅读 · 0 评论 -
所有图片按照固定数量保存到新建文件夹
有很多图片在不同的文件夹中,将所有图片汇集起来,按照固定的数量保存到新建的文件夹中。原创 2024-04-19 11:57:58 · 442 阅读 · 0 评论 -
总结mac下解决matplotlib中文显示问题的几种方法
使⽤matplotlib画图时,由于matplotlib默认没有中⽂,显⽰中文时会出现空⽩⼩⽅块。原创 2024-03-18 10:02:07 · 1657 阅读 · 3 评论 -
Python实现无损放大图片
无损放大”是指在不损失图片质量的情况下,将图片进行放大操作,使图片的分辨率变高。与之相对的是“有损放大”,也就是通过插值等技术进行放大,但是在过程中会丢失部分原本的图片信息,导致放大后的图片像素不清晰或出现锯齿等。原创 2024-01-24 10:05:17 · 1712 阅读 · 0 评论 -
利用Python与Flet写一个图片无损放大软件
将上传的图片无损放大2倍、4倍、8倍。原创 2024-01-23 15:04:17 · 831 阅读 · 0 评论 -
Python总结上传图片到服务器并保存的两种方式
图片保存到服务器的两种方法:1、根据图片的 URL 将其保存到服务器的固定位置2、根据方式从请求中获取上传的图片文件,并将其保存到服务器的固定位置。原创 2023-09-08 16:57:53 · 2414 阅读 · 0 评论 -
Python使用 YOLO_NAS_S 模型进行目标检测并保存预测到的主体图片
使用 YOLO_NAS_S 模型进行目标检测,并保存预测到的主体图片。原创 2023-08-28 13:58:43 · 1382 阅读 · 0 评论 -
Python对图片进行颜色分析并提供图片中的主要颜色以及其相应的出现频率
对图片进行颜色分析,为您提供图片中的主要颜色以及其相应的出现频率。原创 2023-08-14 16:36:11 · 1637 阅读 · 0 评论 -
总结解决Python处理大批量图片时内存爆满的问题
处理大量图片可能会导致内存占用过高,特别是当所有图片都被同时加载到内存中时。原创 2023-08-03 16:50:27 · 2647 阅读 · 0 评论 -
将transformers模型保存到本地及加载本地模型与创建CLIPProcessor实例
由于网络宽带速度不一,所以想着把transformers模型保存到本地,并实现本地加载。原创 2023-07-21 14:41:49 · 9083 阅读 · 0 评论 -
利用Python给图像添加标签
给指定的图片添加标签。原创 2023-07-11 17:21:21 · 1041 阅读 · 0 评论 -
【windows】批量裁剪图片V1.0
注意:本软件未经过360检测,若报病毒,请选择信任!批量将文件夹中所有的图片裁剪为统一像素的图片。2、填写裁减后图片的宽与高像素。1、提交批量图片所在的文件夹。4、点击提交按钮,等待结束。3、选择保存文件的文件夹。原创 2023-03-15 14:23:08 · 403 阅读 · 0 评论 -
利用python实现图片裁剪与拷贝
如果此前没有安装过PIL库,在python3环境下,命令行输入 pip install pillow 即可安装完成。1、cut_out_pic方法参数分别为,图片地址、输出目录地址、起始像素点位置、需要裁剪的宽高。2、做了简单的图片格式校验,如需添加,可以自己看着来。3、最终图片名使用uuid避免重复。4、截取的图片宽高不能超过图片大小。原创 2023-02-16 16:25:58 · 1351 阅读 · 0 评论 -
小案例:利用Python实现图片上下、左右翻转
对图片进行操作,使图片上下、左右翻转。原创 2022-10-12 17:00:19 · 3121 阅读 · 0 评论 -
利用python转换图片格式
前言常见的图像任务通常需要把照片统一成相同的格式,所以此文章正是为了统一格式而生,常见的主要有cv2和PIL.Image的相关操作,照片格式是一串数字加上后缀名工具一:cv2pip install opencv-python之后就可以import cv21.1 导包import osimport cv2import sysimport numpy as np1.2 路径设置path = r"C:\\Users\\86775\\test_ch原创 2022-02-09 10:11:24 · 11156 阅读 · 10 评论 -
用pythone画棵圣诞树,祝大家圣诞快乐
一、python环境:根据电脑的情况去下载对应的python安装包,我使用的是python3.7.0的版本二、python编译器:打开pycharm,然后我们创建一个project,在project下创建一个python file,建议取名字不要使用中文,创建成功后把我的代码复制过去,然后在该页面右键-运行(run)。三、代码:import turtle as t #as就是取个别名,后续调用的t都是turtlefrom turtle import *import random转载 2021-12-24 16:26:42 · 1021 阅读 · 0 评论 -
利用Python实现PDF转文本,就是如此简单!
一、前言对很多人来说,将PDF转换为可编辑的文本是个刚需,却苦于没有简单的方法。发现 pdf 幻灯片,效果还不错。传统的讲座通常伴随有很多pdf幻灯片。一般来说,想要对自己的讲座做笔记,需要从pdf复制、补充大量内容。最近,来自 K1 Digital 的高级机器工程师 Lucas Soares 一直在尝试通过使用 CR(光学字符识别)自动 pdf 幻灯片,以便直接在 Markdown 文件中操作它们的内容,从而避免手动复制和粘贴 pdf 内容,实现这个过程的自动化。图为项目作者卢卡斯·苏原创 2021-10-08 15:03:58 · 3780 阅读 · 2 评论 -
图片操作案例:python 批量更改图像尺寸到统一大小的方法
一、需求:批量修改该图片长与宽尺寸二、素材:三、代码:from PIL import Imageimport os.pathimport globdef convertjpg(jpgfile,outdir,width=512,height=512): img=Image.open(jpgfile) try: new_img=img.resize((width,height),Image.BILINEAR) if not os.path.exists(ou原创 2021-05-20 17:44:02 · 3435 阅读 · 4 评论 -
python实现两张图片横向和纵向拼接
本文实例为大家分享了python实现图片横向和纵向拼接的具体代码,这里主要用Python扩展库pillow中Image对象的paste()方法把两张图片拼接起来供大家参考,具体内容如下:一、代码:from PIL import Imagedef join(png1, png2, flag='horizontal'): """ :param png1: path :param png2: path :param flag: horizontal or ver原创 2021-04-19 11:06:05 · 4053 阅读 · 3 评论 -
小案例:编写立方体六个面,合成一张全景图后端
一、需求:给出立方体六个面,合成一张全景图二、主要知识:py360convert2.1、该项目的特点:立方体贴图和等矩形之间的转换 等角于平面 纯python实现,仅依赖于numpy和scipy 矢量化实施(在大多数地方) c2ee2c在1.6 GHz Intel Core i5 CPU上花费300ms并花费160ms 2.2、安装pip install py360convert现在,您可以在任何地方import py360con..原创 2021-03-05 11:27:36 · 5555 阅读 · 1 评论 -
利用Python把四张图片按照顺序拼接起来
一、需求:给出四张图片,按照一定的顺序拼接起来二、图片:左上角:(像素512*512)右上角:(像素284*512)左下角:(像素284*512)右下角:(像素284*284)三、代码及说明:import skimage.io as ioimport numpy as np# 上面左右拼接jzg = io.imread(r"C:\Users\dyrs\Desktop\aaa\l1_b_1_1.jpg") # np.ndarray, [h, w,原创 2021-02-20 11:40:42 · 4384 阅读 · 3 评论 -
python从图片里提取主要颜色
一、需求:从一张图片里提取主要的几种颜色二、效果:三、代码from PIL import Image, ImageDraw, ImageFontdef get_dominant_colors(infile): image = Image.open(infile) # 缩小图片,否则计算机压力太大 small_image = image.resize((80, 80)) result = small_image.convert( "P"原创 2020-12-21 10:35:16 · 8953 阅读 · 4 评论