自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

采菊东篱下,Python满乾坤!

九层之台起于累土;千里之行始于足下

  • 博客(550)
  • 资源 (1)
  • 收藏
  • 关注

原创 【Python】总结像大模型一样一个字一个字输出的方法

Python编辑代码,实现像大模型回答问题一样,一个字一个字输出。

2025-05-21 17:46:23 247

原创 【Liblib】基于LiblibAI自定义模型,总结一下Python开发步骤

Liblib AI(哩布哩布 AI)是一个集成了先进人工智能技术和用户友好设计的 AI 图像创作绘画平台和模型分享社区。Liblib是个图像ai平台,有根据文字生成图片,修复图片,图片重绘等多种功能。API试用计划:登录后可领取500试用积分,限时7天免费测试体验。

2025-05-14 18:29:04 1498

原创 【OCR】总结目前流行的主要的OCR工具

扫描件上的污渍、老照片的黄斑、手机翻拍的摩尔纹,这些噪声如同数字时代的“文字迷彩服”。从Tesseract的开源先驱到Gemini 2.5 Pro的多模态突破,OCR技术始终在“识别率-速度-成本”的三角中寻找平衡。从楷书的连笔到黑体的刻板,从古籍的竖排繁体到现代文档的多栏混排,文字形态的复杂性远超想象。当遇到“甲乙丙方”等上下文依赖的表述,或“O/1/I”等形似字符时,再先进的算法也可能误判。正如数字世界的翻译官,OCR的价值不在于完美,而在于让沉默的文字重新开口说话。

2025-04-09 13:47:14 1037

原创 【Python】从 Word 文档中提取图片并生成 PPT

用于读取 Word 文档内容。:用于创建 PowerPoint 幻灯片。Pillow:用于处理图片尺寸和格式。io:用于处理内存中的二进制数据流。遍历指定文件夹中的所有 Word 文件。使用提取 Word 文档中的图片。将提取的图片插入到 PowerPoint 幻灯片中。保存生成的 PPT 文件。通过本文的代码示例,你可以轻松实现从 Word 文档中提取图片并生成 PPT 的自动化流程。这种解决方案不仅提高了工作效率,还减少了人为操作的错误率。

2025-03-26 16:04:34 630

原创 Python中文大写金额转阿拉伯数字

在财务票据中,中文大写金额(如“贰拾捌万壹仟柒佰伍拾伍元壹角玖分”)被广泛使用以防止篡改。但在数据处理时,我们需要将其转换为阿拉伯数字形式。本文将带你一步步解析如何用Python实现这一转换。

2025-03-20 15:35:07 262

原创 【OCR】总结github上开源 OCR 工具:让文字识别更简单

在数字化的时代,光学字符识别(OCR)技术成为了我们处理文档、图像文字信息的得力助手。它能够将图像中的文字信息转换为可编辑和可处理的文本数据,极大地提高了信息处理的效率。今天,我要给大家介绍一些优秀的开源 OCR 工具,它们在不同的场景下各显神通,让我们一起来看看它们的强大之处吧!

2025-03-19 14:00:46 3299

原创 【OCR】使用Umi-OCR进行PDF文档的光学字符识别

Umi-OCR是一款开源的离线OCR工具,支持多种语言的文字识别,特别适用于中文文档。它提供了一个基于HTTP的API接口,使得集成到各种应用中变得更加容易。通过上述步骤,我们能够利用Umi-OCR高效地对PDF文档执行OCR操作,将不可编辑的扫描版PDF转换为结构化的文本信息。这个过程不仅简化了数据录入的工作量,也提高了信息检索的效率。希望这篇文章能帮助您快速上手Umi-OCR,并应用于实际项目中。

2025-03-19 09:55:42 1126

原创 【PDF识别】总结PDF文本内容与表格提取的方法

pdfminer是一个高度可定制的PDF处理库,适用于需要深度自定义提取逻辑的场景。在PDF文本与表格提取的征程中,我们遇到了各种挑战,也探索了多种解决方案。简单文本提取:PyPDF2和fitz是不错的选择,简单易用,适合初学者快速上手。表格与精确文本提取:pdfplumber在处理表格方面表现出色,能够满足对文本和表格精确提取的需求。复杂PDF处理:pdfminer的灵活性使其能够应对复杂的PDF结构,适合需要深度自定义提取逻辑的场景。扫描PDF处理。

2025-03-18 14:26:36 1726

原创 Python数字金额转化为大写形式

1、如何将数字转换成中文大写数字。这需要一个映射表,将数字0-9映射到对应的中文大写数字。同时,还需要处理进位单位,如拾、佰、仟等,以及更大的单位如万、亿。2、处理金额的整数部分和小数部分。整数部分可能需要分解成亿、万、个等部分,每个部分分别转换成中文大写形式。小数部分则直接处理为角和分。在处理过程中,需要考虑一些特殊情况,比如连续的零如何处理,以及如何避免出现重复的零。此外,还需要确保金额的结尾处理正确,比如当分和角都为零时,需要添加“整”。

2025-03-17 15:02:00 505

原创 【DeepSeek】一键把DeepSeek+个人知识库部署在你电脑

AingDesk 是一款由国内团队开发的开源 AI 客户端工具,致力于零门槛实现本地化 AI 部署与管理。通过可视化界面,用户可一键将 DeepSeek、Llama 等上百款主流 AI 模型部署至个人电脑,同时集成个人知识库管理和深度联网搜索功能,实现“本地算力+云端智能”的混合架构。

2025-03-12 13:48:27 811

原创 【Monica】国内版 Monica AI 助手正式发布,开启免费内测啦!限量内测邀请码

大家期待已久的 Monica 国内版终于来临!这是一款基于满血版模型打造的 AI 助手,它拥有 "智慧大脑" 和深度推理能力,运行速度飞快,能一站式满足你在工作、学习和生活中的各种需求。现在,让我们一起了解这款强大的 AI 助手。传统聊天机器人功能单一,仅能进行简单对话,面对复杂任务和问题往往无能为力。但完全不同,它是一个真正的全能 AI 工具。无论是复杂的学术问题还是日常生活的小困惑,Monica 都能给出精准且贴心的回答。它可以联网搜索实时信息,进行深度思考,提供全面深入的解决方案。

2025-03-07 10:11:03 1444

原创 【Manus】AI 代理人正式上岗-附Manus邀请码限时通道

在AI的世界里,我们早已习惯了它的存在。从简单的聊天机器人到复杂的文案生成器,AI似乎一直是那个“聪明的助手”,但似乎总差那么一点“实用性”。直到ChatGPT的出现,我们才惊呼:“原来AI可以这样!”然而,当Manus横空出世时,我们才发现——AI的潜力远不止于此。

2025-03-06 22:44:26 2841 1

原创 【DeepSeek】总结支持DeepSeek满血版的平台

硅基流动平台上的DeepSeek R1 满血版,虽然比官网稳定,但是比速度变得比官网要慢,于是后续硅基流动又推出了DeepSeek R1 满血版的Pro版,但是Pro版只能用你充值的额度,获赠额度只能用普通的DeepSeek R1 满血版。我个人也用Pro版居多一些。天工AI是上市公司昆仑万维旗下的AI工具,在搜索界面增加了对DeepSeek的支持,使用效果界面跟秘塔AI搜索和360的纳米搜索基本一样,目前也是免费使用,只不过网页版整体看起来有些杂乱,除了自带的图文社区的广告知外,还有不少预设的智能体。

2025-02-26 09:11:10 1825

原创 【DeepSeek】总结本地部署DeepSeek硬件配置清单

非必需(纯 CPU 推理),若 GPU 加速可选 4GB+ 显存(如 GTX 1650)24GB+ 显存(如 A100 40GB 或双卡 RTX 3090)多卡并行(如 2x A100 80GB 或 4x RTX 4090)16GB+ 显存(如 RTX 4090 或 A5000)推荐 8GB+ 显存(如 RTX 3070/4060)推荐 8GB+ 显存(如 RTX 3070/4060)3GB+ 存储空间(模型文件约 1.5-2GB)8GB+(模型文件约 4-5GB)8GB+(模型文件约 4-5GB)

2025-02-24 17:02:24 4955

原创 【DeepSeek】总结10个免费的DeepSeek使用平台

硅基流动是一家AI模型服务商,提供了R1、V3满血版以及DS多尺寸模型,还包括GLM、Qwen、Hunyuan、Yi、FLUX、Llama、SD等知名模型。华为云、阿里云、京东云、腾讯云、火山引擎、华为昇腾社区、联通云、百度智能云等云厂商都已接入DeepSeek,并提供了一定的免费体验额度。选择Siliconflow API后,把硅基流动的API密钥粘贴进去,选择模型deepseek-aiDeepSeek-R1,点保存,然后就可以了。想要体验满血版功能,推荐官网和硅基流动,但需注意可能存在的卡顿问题;

2025-02-20 15:48:16 3378

原创 《王者荣耀》操作技巧与排位赛策略指南

关于《王者荣耀》操作技巧、排位赛策略以及匹配机制相关内容整理成的完整文档。这份文档涵盖了英雄操作技巧提升、排位赛策略、匹配机制解析以及实战建议,适合玩家系统学习和参考。观看回放每场比赛结束后,观看回放,总结自己的操作失误和亮点。分析团队配合问题,找出需要改进的地方。调整策略根据对局中的问题,调整英雄选择、装备搭配或战术思路。总结经验教训,避免在后续对局中重复同样的错误。

2025-02-20 10:06:05 1131

原创 【OCR】基于深度学习的验证码识别模型训练的方法

数据预处理:将验证码文本标签转换为独热编码向量。:将独热编码向量转换回文本标签。:从指定目录加载图片数据,并将RGB图片转换为灰度图片,同时从文件名中提取标签。模型定义:定义了一个卷积神经网络(CNN)模型,用于定长验证码的识别。模型包含多层卷积、池化和全连接层,最终输出验证码的预测结果。训练过程train函数:加载训练和验证数据,初始化模型,使用回调函数(如)监控训练过程,并保存最佳模型。预测功能Predictor类:加载训练好的模型,提供单张图片或远程图片的预测功能。

2025-02-18 09:49:24 1069

原创 【OCR】总结Python中图片与pdf识别文本的方法

性能强大,适合复杂场景的文字识别。:封装了多个 OCR 引擎(如 Tesseract、Cuneiform 等),提供了统一的接口。:Tesseract 的 Python 封装,支持多种语言,使用简单,适合传统 OCR 任务。注意:根据你的具体需求(如语言支持、应用场景、性能要求等),可以选择最适合的 OCR 库。:易于使用,支持多种语言(包括中文、英文等),基于深度学习技术,适合初学者和快速集成。:专注于文档分析和表格识别,能够提取文档中的结构化信息,适合处理复杂布局的文档。

2025-02-14 16:41:06 3101 1

原创 【ima】DeepSeek-R1模型实时调用,去除服务器繁忙等待烦恼

近日,腾讯旗下智能工作台 ima.copilot(简称 ima)在技术层面进行了重要升级,悄悄地接入了 DeepSeek-R1 模型。用户将 ima 更新至最新版本后,在使用搜、读、写和知识库等功能时,可以选择腾讯混元大模型或 DeepSeek-R1 模型,从而获得更丰富的使用体验。

2025-02-14 09:58:17 1432

原创 【Python】基于Tesseract OCR的文本识别方法及代码示例

什么是 OCROCR,即,是光学字符识别的简称。它是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简言之,OCR技术可以将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。OCR技术基于图像处理和模型识别技术,其应用场景非常广泛,包括文档数字化、数据提取、自动翻译、安全监控、智能客服等,还可以应用于医疗、金融、教育等领域。衡量一个OCR。

2025-02-13 17:02:28 1935

原创 总结谷歌浏览器取消更新的方法

依次展开「任务计划程序库」 > 「GoogleSystem」 > 「GoogleUpdater」。点击「停止」按钮,并将「启动类型」设置为「禁用」。在弹出的窗口中切换到「服务」选项卡。快捷键打开「运行」对话框,输入。点击「应用」并关闭「服务」管理器。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。并回车,打开「系统配置」工具。并回车,打开「任务计划程序」。并回车,打开「服务」管理器。将该列表中的所有任务计划禁用。并回车,打开注册表编辑器。

2025-02-13 16:15:30 1990

原创 国产开源 AI DeepSeek 学习手册推荐

这份手册深入解析了国产开源 AI DeepSeek 的强大功能,无论是 AI 领域的初学者,还是想要进一步提升技能的学习者,都能从中受益匪浅,轻松开启从入门到精通 AI的 学习之旅,掌握 AI 的高效应用方法,让你在 AI 世界中如鱼得水。为了让有需要的朋友们能够方便地获取这份宝贵的学习资源,我已经将其完整资料打包上传到了网盘。希望大家都能通过这份手册,更好地了解和使用 DeepSeek,开启 AI 学习与应用的新篇章!网盘链接:https://pan.quark.cn/s/c7ac371a8af0。

2025-02-11 14:49:58 255

原创 总结UiPath Studio的介绍与安装步骤

UiPath Studio是一款先进且专业的自动化软件,也是实现应用程序集成和自动化第三方应用程序、管理 IT 任务和 IT 流程等的完整解决方案。

2024-11-28 14:49:38 1518

原创 PymuPDF4llm提取pdf文件文字、表格与图片

PymuPDF4llm 的文本提取功能非常简单易用。只需使用pip install pymupdf4llm进行安装,然后通过import pymupdf4llm导入库,就可以使用md_text = pymupdf4llm.to_markdown("input.pdf")语句轻松地从 PDF 文件中提取文本,并以 Markdown 格式呈现。例如,如果有一个包含大量文字的学术论文 PDF,PymuPDF4llm 可以快速准确地提取其中的文本内容,为后续的研究和分析提供便利。

2024-11-07 17:25:33 2528

原创 UiPath调用Python脚本的完整示例

a、添加python作用域b、加载python脚本c、调用python方法d、获取python对象e、显示Python结果的消息对话框。

2024-11-01 14:38:15 904

原创 Python中两个float值相对比

在Python中,由于浮点数的表示通常是近似的,直接使用等号(==)来比较两个浮点数是否相等可能会导致意外的结果。这是因为浮点数在计算机中的存储方式可能导致微小的误差。因此,比较两个浮点数是否“相等”时,通常需要定义一个“容差”(tolerance)或“精度”(precision),来判断两个数是否在可接受的误差范围内相等。如果你不想使用num2 = 0.3# 使用自定义函数比较print(are_close) # 输出: True。

2024-10-16 14:19:00 611

原创 Linux中安装tesserocr遇到的那些坑

是正确的,并且是你的Tesseract OCR语言数据文件所在的目录。如果一切正常,你将看到Tesseract的版本信息。: 打开终端,并根据你的Linux发行版,选择编辑。环境变量添加到系统环境变量中,设置其值为。是你需要安装的语言代码,例如英语是。: 为了让更改立即生效,你需要重新加载。: 你可以通过在终端运行以下命令来检查。先安装Tesseract OCR。linux命令安装,提示失败。再安装tesserocr。再运行程序,便正常了。,或者为当前用户编辑。确认保存更改,最后按。

2024-10-15 10:24:25 706

原创 Linux系统中安装KenLM步骤及注意事项

如果您希望在不使用sudo的情况下运行KenLM的二进制文件,您可能需要将KenLM的安装目录添加到您的PATH环境变量中。您可以通过运行KenLM的二进制文件来验证安装是否成功。您可以使用系统的包管理器来安装这些依赖项。如果您的系统中安装了GCC,那么通常也会安装。)被成功检测到并工作正常,但CMake需要C++编译器来编译KenLM中的C++代码。注意:路径和命令可能因您的系统配置和KenLM的版本而有所不同。解压源代码后,进入KenLM的源代码目录,并创建一个构建目录。您可以从KenLM的官方网站(

2024-10-11 15:54:45 725

原创 JioNLP:一款实用的中文NLP预处理工具包

JioNLP是一个面向NLP开发者的工具包,提供了常见的中文文本预处理、解析等功能,使用简单、高效准确、无需配置,可极大加快NLP项目的开发进度。代码开源,使用MIT协议功能丰富,涵盖多个NLP预处理需求使用简单,无需复杂配置即可调用准确高效,算法经过精心设计和性能优化文档完善,提供详细使用说明JioNLP为NLP开发者提供了实用的预处理解析工具,有效减轻了开发负担,值得去了解和使用。

2024-10-08 14:00:05 1112

原创 Python读取pdf中的文字与表格

在使用 pdfplumber 提取表格时,可能需要安装额外的依赖,如 ImageMagick 和 GhostScript。特别是 ImageMagick,如果您需要使用 to_image 函数进行可视化调试,建议安装6.x版本而非最新的7.x版本。安装完成后,您可以在Python脚本中导入 pdfplumber 并使用其功能来提取PDF文件中的文本和表格数据。它在处理表格方面特别有用。或者,如果您在虚拟环境中工作,确保您已经激活了相应的虚拟环境,然后在虚拟环境中运行上述命令。

2024-10-08 10:45:21 2308

原创 总结uwsgi+anaconda+django启动遇到的问题

用conda安装uwsgi就可以了。这个应该和conda的环境有关系。这个不行的,安装成功,但是anaconda环境下使用就会出这个问题。不管怎么改配置都报这个错,网上很多解答,但是没有成功的。

2024-09-26 08:57:30 581

原创 Python识别文字中的省市区

注意:目前 cpca 模块仅支持Python3及以上版本。

2024-09-18 15:55:57 613

原创 python 识别省市、区县并组建三级信息数据库

根据这段源码可看出,在选择 省级的后,网页会调用selectJson接口进行一个post请求,上图可以看到请求的body和header等信息。检查网页源码可以发现: 所有省级信息全部在javaScript下的json中,会在页面加载时加载json数据,填充到页面的option中。注意:部分省有特殊的“直辖县级行政单位”或“自治区直辖县级行政单位”代码执行成功后就可以查到中国所有省市区啦!

2024-09-18 14:29:32 1072

原创 总结中文纠错项目走过的那些坑(pycorrector)

pycorrector: 中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3.8开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果。地址:https://kkgithub.com/shibing624/pycorrector/blob/master/README.md

2024-09-13 11:08:10 859

原创 总结python合并两个字典的方法

在大多数情况下,推荐使用{**dict1, **dict2}(如果Python版本是3.5或更高)或dict1.update(dict2)(如果你不介意修改原始字典)来合并两个字典。

2024-09-12 18:23:11 462

原创 360在线翻译免费API

根据360在线翻译,获取免费API,并调用。

2024-04-23 13:53:03 641

原创 所有图片按照固定数量保存到新建文件夹

有很多图片在不同的文件夹中,将所有图片汇集起来,按照固定的数量保存到新建的文件夹中。

2024-04-19 11:57:58 449

原创 总结批量创建文件夹及文件重命名、移动的方法

1、根据一个文件夹的所有文件夹名称,批量创建另一个文件夹,并重命名新的文件夹2、根据提供的数据,获取图片名称,并修改为新的文件名称,保存到json文件中3、根据提供的图片,复制图片到指定文件夹,并重命名图片。

2024-04-19 10:05:33 821

原创 零一万物:Yi Model API 调用说明

Yi Model API 支持使用以下 Yi 系列模型。

2024-03-18 10:38:31 3342

原创 总结mac下解决matplotlib中文显示问题的几种方法

使⽤matplotlib画图时,由于matplotlib默认没有中⽂,显⽰中文时会出现空⽩⼩⽅块。

2024-03-18 10:02:07 1676 3

文件搜索利器 Everything v1.5.0

Everything功能特色: 可以快速索引并搜索计算机上存储的所有文件和文件夹,搜索结果准确、快速。 具有小巧、便捷的特点,安装文件非常小,并且使用非常简单。 采用实时更新技术,搜索结果在创建或修改文件时立即更新,这意味着搜索结果永远是最新的。 不仅支持基本的文件名搜索,还支持高级文件名搜索,如通配符(*和?)、正则表达式等搜索方式,可以快速定位需要的文件。 用户可以使用多种条件设置过滤器,以限制搜索结果的范围,例如按文件类型、大小、日期等属性过滤。 支持多种排序方式,比如按名称、大小、日期等标准排序,还支持自定义排序方式。 可以通过LAN(局域网)搜索其他网络计算机上的文件,支持对共享文件夹的搜索和管理。 可以轻松地分享文件和文件夹给他人,只需要将搜索结果复制到剪贴板即可。 支持多种外观设置,例如修改字体、颜色等,同时也支持多种语言和插件扩展。 还支持多种搜索方式,包括模糊搜索、全词搜索、大小写敏感搜索等。 可以通过自动运行功能,使 Everything 开机自动启动并开始索引文件,以便更快地进行搜索。 可以快速访问最近使用的文件和文件夹,同时还可以收藏最常用的文件和文件夹。

2024-11-29

文字转语音合成工具 VPot v2411 单文件版( 支持win 7 - 11 )

VPot是一款免费无广的文字转语音的工具,内置多语种多声音角色,可将任意文字内容转换为流畅的语音文件,完全调用微软及edge公共API接口,纯CPU处理,适用于譬如短视频配音、教学平台、有声读书等各种应用场景。如侵请删~~~ 虽然这类软件多的是,尤其是在线网页版确实不计其数,缺点都是限制字数的居多,不排除要登录及限制次数的可能。另外,某些真人克l类TTS也相当成熟,无奈老旧系统无缘,但这些均不在本帖讨论及推荐范围之内。 而此款并无以上束缚,u1s1这么多厂商的TTS当中唯有微软TTS的声音合成算是yyds,简洁而无登录接口,不限次数不限字数,实现不失真全输出,支持 win 7 – 11 64位系统 。 软件特点: 1. 支持导入txt、srt字幕文件; 2. 实现音频文件管理,方便反复试听和对比; 3. 现可自选音频保存目录; 4. 保留超长文本转录的可行性; 5. 文件重命名不再受软件影响。

2024-11-29

一键AI抠图更换背景Digiarty.AIArty.Image.Matting.v2.0

Aiarty Image Matting使用人工智能自动处理复杂图像,使处理产品、肖像、徽标等变得更加容易。借助简化、用户友好的界面,任何人只需单击几下即可获得专业品质的结果,无需手动编辑。 针对半透明对象抠图进行了优化: 使用深度卷积层捕捉图像中的复杂特征,例如婚纱、蕾丝、薄纱、玻璃和水滴。专业地保持半透明属性并优化边缘细节,以便与新背景更自然地融合。 产品图片批量背景替换: 智能物体识别,批量背景替换。识别并处理多达 3,000 张产品照片,同时更换背景。 高精度 Alpha 抠图: 通过动态透明度控制和边缘优化,即使在困难的边缘情况下,也能更进一步。这确保了出色的细节保留并使背景集成无缝。 多功能背景效果: 用透明度、纯色、模糊等自定义效果或其他图像替换背景。突出主题并为电子商务、个人项目等创作引人注目的作品。

2024-11-29

浏览器插件:广告拦截器

浏览器插件:广告拦截器

2024-11-28

网页播放视频播放加速器,适合刷视频的人

网页播放视频播放加速器,适合刷视频的人

2023-04-23

微信小程序-爱靓女

微信小程序源码,小程序的初级教程,最基本的要求,练手的好项目

2018-09-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除