- 博客(550)
- 资源 (1)
- 收藏
- 关注
原创 【Liblib】基于LiblibAI自定义模型,总结一下Python开发步骤
Liblib AI(哩布哩布 AI)是一个集成了先进人工智能技术和用户友好设计的 AI 图像创作绘画平台和模型分享社区。Liblib是个图像ai平台,有根据文字生成图片,修复图片,图片重绘等多种功能。API试用计划:登录后可领取500试用积分,限时7天免费测试体验。
2025-05-14 18:29:04
1498
原创 【OCR】总结目前流行的主要的OCR工具
扫描件上的污渍、老照片的黄斑、手机翻拍的摩尔纹,这些噪声如同数字时代的“文字迷彩服”。从Tesseract的开源先驱到Gemini 2.5 Pro的多模态突破,OCR技术始终在“识别率-速度-成本”的三角中寻找平衡。从楷书的连笔到黑体的刻板,从古籍的竖排繁体到现代文档的多栏混排,文字形态的复杂性远超想象。当遇到“甲乙丙方”等上下文依赖的表述,或“O/1/I”等形似字符时,再先进的算法也可能误判。正如数字世界的翻译官,OCR的价值不在于完美,而在于让沉默的文字重新开口说话。
2025-04-09 13:47:14
1037
原创 【Python】从 Word 文档中提取图片并生成 PPT
用于读取 Word 文档内容。:用于创建 PowerPoint 幻灯片。Pillow:用于处理图片尺寸和格式。io:用于处理内存中的二进制数据流。遍历指定文件夹中的所有 Word 文件。使用提取 Word 文档中的图片。将提取的图片插入到 PowerPoint 幻灯片中。保存生成的 PPT 文件。通过本文的代码示例,你可以轻松实现从 Word 文档中提取图片并生成 PPT 的自动化流程。这种解决方案不仅提高了工作效率,还减少了人为操作的错误率。
2025-03-26 16:04:34
630
原创 Python中文大写金额转阿拉伯数字
在财务票据中,中文大写金额(如“贰拾捌万壹仟柒佰伍拾伍元壹角玖分”)被广泛使用以防止篡改。但在数据处理时,我们需要将其转换为阿拉伯数字形式。本文将带你一步步解析如何用Python实现这一转换。
2025-03-20 15:35:07
262
原创 【OCR】总结github上开源 OCR 工具:让文字识别更简单
在数字化的时代,光学字符识别(OCR)技术成为了我们处理文档、图像文字信息的得力助手。它能够将图像中的文字信息转换为可编辑和可处理的文本数据,极大地提高了信息处理的效率。今天,我要给大家介绍一些优秀的开源 OCR 工具,它们在不同的场景下各显神通,让我们一起来看看它们的强大之处吧!
2025-03-19 14:00:46
3299
原创 【OCR】使用Umi-OCR进行PDF文档的光学字符识别
Umi-OCR是一款开源的离线OCR工具,支持多种语言的文字识别,特别适用于中文文档。它提供了一个基于HTTP的API接口,使得集成到各种应用中变得更加容易。通过上述步骤,我们能够利用Umi-OCR高效地对PDF文档执行OCR操作,将不可编辑的扫描版PDF转换为结构化的文本信息。这个过程不仅简化了数据录入的工作量,也提高了信息检索的效率。希望这篇文章能帮助您快速上手Umi-OCR,并应用于实际项目中。
2025-03-19 09:55:42
1126
原创 【PDF识别】总结PDF文本内容与表格提取的方法
pdfminer是一个高度可定制的PDF处理库,适用于需要深度自定义提取逻辑的场景。在PDF文本与表格提取的征程中,我们遇到了各种挑战,也探索了多种解决方案。简单文本提取:PyPDF2和fitz是不错的选择,简单易用,适合初学者快速上手。表格与精确文本提取:pdfplumber在处理表格方面表现出色,能够满足对文本和表格精确提取的需求。复杂PDF处理:pdfminer的灵活性使其能够应对复杂的PDF结构,适合需要深度自定义提取逻辑的场景。扫描PDF处理。
2025-03-18 14:26:36
1726
原创 Python数字金额转化为大写形式
1、如何将数字转换成中文大写数字。这需要一个映射表,将数字0-9映射到对应的中文大写数字。同时,还需要处理进位单位,如拾、佰、仟等,以及更大的单位如万、亿。2、处理金额的整数部分和小数部分。整数部分可能需要分解成亿、万、个等部分,每个部分分别转换成中文大写形式。小数部分则直接处理为角和分。在处理过程中,需要考虑一些特殊情况,比如连续的零如何处理,以及如何避免出现重复的零。此外,还需要确保金额的结尾处理正确,比如当分和角都为零时,需要添加“整”。
2025-03-17 15:02:00
505
原创 【DeepSeek】一键把DeepSeek+个人知识库部署在你电脑
AingDesk 是一款由国内团队开发的开源 AI 客户端工具,致力于零门槛实现本地化 AI 部署与管理。通过可视化界面,用户可一键将 DeepSeek、Llama 等上百款主流 AI 模型部署至个人电脑,同时集成个人知识库管理和深度联网搜索功能,实现“本地算力+云端智能”的混合架构。
2025-03-12 13:48:27
811
原创 【Monica】国内版 Monica AI 助手正式发布,开启免费内测啦!限量内测邀请码
大家期待已久的 Monica 国内版终于来临!这是一款基于满血版模型打造的 AI 助手,它拥有 "智慧大脑" 和深度推理能力,运行速度飞快,能一站式满足你在工作、学习和生活中的各种需求。现在,让我们一起了解这款强大的 AI 助手。传统聊天机器人功能单一,仅能进行简单对话,面对复杂任务和问题往往无能为力。但完全不同,它是一个真正的全能 AI 工具。无论是复杂的学术问题还是日常生活的小困惑,Monica 都能给出精准且贴心的回答。它可以联网搜索实时信息,进行深度思考,提供全面深入的解决方案。
2025-03-07 10:11:03
1444
原创 【Manus】AI 代理人正式上岗-附Manus邀请码限时通道
在AI的世界里,我们早已习惯了它的存在。从简单的聊天机器人到复杂的文案生成器,AI似乎一直是那个“聪明的助手”,但似乎总差那么一点“实用性”。直到ChatGPT的出现,我们才惊呼:“原来AI可以这样!”然而,当Manus横空出世时,我们才发现——AI的潜力远不止于此。
2025-03-06 22:44:26
2841
1
原创 【DeepSeek】总结支持DeepSeek满血版的平台
硅基流动平台上的DeepSeek R1 满血版,虽然比官网稳定,但是比速度变得比官网要慢,于是后续硅基流动又推出了DeepSeek R1 满血版的Pro版,但是Pro版只能用你充值的额度,获赠额度只能用普通的DeepSeek R1 满血版。我个人也用Pro版居多一些。天工AI是上市公司昆仑万维旗下的AI工具,在搜索界面增加了对DeepSeek的支持,使用效果界面跟秘塔AI搜索和360的纳米搜索基本一样,目前也是免费使用,只不过网页版整体看起来有些杂乱,除了自带的图文社区的广告知外,还有不少预设的智能体。
2025-02-26 09:11:10
1825
原创 【DeepSeek】总结本地部署DeepSeek硬件配置清单
非必需(纯 CPU 推理),若 GPU 加速可选 4GB+ 显存(如 GTX 1650)24GB+ 显存(如 A100 40GB 或双卡 RTX 3090)多卡并行(如 2x A100 80GB 或 4x RTX 4090)16GB+ 显存(如 RTX 4090 或 A5000)推荐 8GB+ 显存(如 RTX 3070/4060)推荐 8GB+ 显存(如 RTX 3070/4060)3GB+ 存储空间(模型文件约 1.5-2GB)8GB+(模型文件约 4-5GB)8GB+(模型文件约 4-5GB)
2025-02-24 17:02:24
4955
原创 【DeepSeek】总结10个免费的DeepSeek使用平台
硅基流动是一家AI模型服务商,提供了R1、V3满血版以及DS多尺寸模型,还包括GLM、Qwen、Hunyuan、Yi、FLUX、Llama、SD等知名模型。华为云、阿里云、京东云、腾讯云、火山引擎、华为昇腾社区、联通云、百度智能云等云厂商都已接入DeepSeek,并提供了一定的免费体验额度。选择Siliconflow API后,把硅基流动的API密钥粘贴进去,选择模型deepseek-aiDeepSeek-R1,点保存,然后就可以了。想要体验满血版功能,推荐官网和硅基流动,但需注意可能存在的卡顿问题;
2025-02-20 15:48:16
3378
原创 《王者荣耀》操作技巧与排位赛策略指南
关于《王者荣耀》操作技巧、排位赛策略以及匹配机制相关内容整理成的完整文档。这份文档涵盖了英雄操作技巧提升、排位赛策略、匹配机制解析以及实战建议,适合玩家系统学习和参考。观看回放每场比赛结束后,观看回放,总结自己的操作失误和亮点。分析团队配合问题,找出需要改进的地方。调整策略根据对局中的问题,调整英雄选择、装备搭配或战术思路。总结经验教训,避免在后续对局中重复同样的错误。
2025-02-20 10:06:05
1131
原创 【OCR】基于深度学习的验证码识别模型训练的方法
数据预处理:将验证码文本标签转换为独热编码向量。:将独热编码向量转换回文本标签。:从指定目录加载图片数据,并将RGB图片转换为灰度图片,同时从文件名中提取标签。模型定义:定义了一个卷积神经网络(CNN)模型,用于定长验证码的识别。模型包含多层卷积、池化和全连接层,最终输出验证码的预测结果。训练过程train函数:加载训练和验证数据,初始化模型,使用回调函数(如)监控训练过程,并保存最佳模型。预测功能Predictor类:加载训练好的模型,提供单张图片或远程图片的预测功能。
2025-02-18 09:49:24
1069
原创 【OCR】总结Python中图片与pdf识别文本的方法
性能强大,适合复杂场景的文字识别。:封装了多个 OCR 引擎(如 Tesseract、Cuneiform 等),提供了统一的接口。:Tesseract 的 Python 封装,支持多种语言,使用简单,适合传统 OCR 任务。注意:根据你的具体需求(如语言支持、应用场景、性能要求等),可以选择最适合的 OCR 库。:易于使用,支持多种语言(包括中文、英文等),基于深度学习技术,适合初学者和快速集成。:专注于文档分析和表格识别,能够提取文档中的结构化信息,适合处理复杂布局的文档。
2025-02-14 16:41:06
3101
1
原创 【ima】DeepSeek-R1模型实时调用,去除服务器繁忙等待烦恼
近日,腾讯旗下智能工作台 ima.copilot(简称 ima)在技术层面进行了重要升级,悄悄地接入了 DeepSeek-R1 模型。用户将 ima 更新至最新版本后,在使用搜、读、写和知识库等功能时,可以选择腾讯混元大模型或 DeepSeek-R1 模型,从而获得更丰富的使用体验。
2025-02-14 09:58:17
1432
原创 【Python】基于Tesseract OCR的文本识别方法及代码示例
什么是 OCROCR,即,是光学字符识别的简称。它是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。简言之,OCR技术可以将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。OCR技术基于图像处理和模型识别技术,其应用场景非常广泛,包括文档数字化、数据提取、自动翻译、安全监控、智能客服等,还可以应用于医疗、金融、教育等领域。衡量一个OCR。
2025-02-13 17:02:28
1935
原创 总结谷歌浏览器取消更新的方法
依次展开「任务计划程序库」 > 「GoogleSystem」 > 「GoogleUpdater」。点击「停止」按钮,并将「启动类型」设置为「禁用」。在弹出的窗口中切换到「服务」选项卡。快捷键打开「运行」对话框,输入。点击「应用」并关闭「服务」管理器。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。快捷键打开「运行」对话框,输入。并回车,打开「系统配置」工具。并回车,打开「任务计划程序」。并回车,打开「服务」管理器。将该列表中的所有任务计划禁用。并回车,打开注册表编辑器。
2025-02-13 16:15:30
1990
原创 国产开源 AI DeepSeek 学习手册推荐
这份手册深入解析了国产开源 AI DeepSeek 的强大功能,无论是 AI 领域的初学者,还是想要进一步提升技能的学习者,都能从中受益匪浅,轻松开启从入门到精通 AI的 学习之旅,掌握 AI 的高效应用方法,让你在 AI 世界中如鱼得水。为了让有需要的朋友们能够方便地获取这份宝贵的学习资源,我已经将其完整资料打包上传到了网盘。希望大家都能通过这份手册,更好地了解和使用 DeepSeek,开启 AI 学习与应用的新篇章!网盘链接:https://pan.quark.cn/s/c7ac371a8af0。
2025-02-11 14:49:58
255
原创 总结UiPath Studio的介绍与安装步骤
UiPath Studio是一款先进且专业的自动化软件,也是实现应用程序集成和自动化第三方应用程序、管理 IT 任务和 IT 流程等的完整解决方案。
2024-11-28 14:49:38
1518
原创 PymuPDF4llm提取pdf文件文字、表格与图片
PymuPDF4llm 的文本提取功能非常简单易用。只需使用pip install pymupdf4llm进行安装,然后通过import pymupdf4llm导入库,就可以使用md_text = pymupdf4llm.to_markdown("input.pdf")语句轻松地从 PDF 文件中提取文本,并以 Markdown 格式呈现。例如,如果有一个包含大量文字的学术论文 PDF,PymuPDF4llm 可以快速准确地提取其中的文本内容,为后续的研究和分析提供便利。
2024-11-07 17:25:33
2528
原创 UiPath调用Python脚本的完整示例
a、添加python作用域b、加载python脚本c、调用python方法d、获取python对象e、显示Python结果的消息对话框。
2024-11-01 14:38:15
904
原创 Python中两个float值相对比
在Python中,由于浮点数的表示通常是近似的,直接使用等号(==)来比较两个浮点数是否相等可能会导致意外的结果。这是因为浮点数在计算机中的存储方式可能导致微小的误差。因此,比较两个浮点数是否“相等”时,通常需要定义一个“容差”(tolerance)或“精度”(precision),来判断两个数是否在可接受的误差范围内相等。如果你不想使用num2 = 0.3# 使用自定义函数比较print(are_close) # 输出: True。
2024-10-16 14:19:00
611
原创 Linux中安装tesserocr遇到的那些坑
是正确的,并且是你的Tesseract OCR语言数据文件所在的目录。如果一切正常,你将看到Tesseract的版本信息。: 打开终端,并根据你的Linux发行版,选择编辑。环境变量添加到系统环境变量中,设置其值为。是你需要安装的语言代码,例如英语是。: 为了让更改立即生效,你需要重新加载。: 你可以通过在终端运行以下命令来检查。先安装Tesseract OCR。linux命令安装,提示失败。再安装tesserocr。再运行程序,便正常了。,或者为当前用户编辑。确认保存更改,最后按。
2024-10-15 10:24:25
706
原创 Linux系统中安装KenLM步骤及注意事项
如果您希望在不使用sudo的情况下运行KenLM的二进制文件,您可能需要将KenLM的安装目录添加到您的PATH环境变量中。您可以通过运行KenLM的二进制文件来验证安装是否成功。您可以使用系统的包管理器来安装这些依赖项。如果您的系统中安装了GCC,那么通常也会安装。)被成功检测到并工作正常,但CMake需要C++编译器来编译KenLM中的C++代码。注意:路径和命令可能因您的系统配置和KenLM的版本而有所不同。解压源代码后,进入KenLM的源代码目录,并创建一个构建目录。您可以从KenLM的官方网站(
2024-10-11 15:54:45
725
原创 JioNLP:一款实用的中文NLP预处理工具包
JioNLP是一个面向NLP开发者的工具包,提供了常见的中文文本预处理、解析等功能,使用简单、高效准确、无需配置,可极大加快NLP项目的开发进度。代码开源,使用MIT协议功能丰富,涵盖多个NLP预处理需求使用简单,无需复杂配置即可调用准确高效,算法经过精心设计和性能优化文档完善,提供详细使用说明JioNLP为NLP开发者提供了实用的预处理解析工具,有效减轻了开发负担,值得去了解和使用。
2024-10-08 14:00:05
1112
原创 Python读取pdf中的文字与表格
在使用 pdfplumber 提取表格时,可能需要安装额外的依赖,如 ImageMagick 和 GhostScript。特别是 ImageMagick,如果您需要使用 to_image 函数进行可视化调试,建议安装6.x版本而非最新的7.x版本。安装完成后,您可以在Python脚本中导入 pdfplumber 并使用其功能来提取PDF文件中的文本和表格数据。它在处理表格方面特别有用。或者,如果您在虚拟环境中工作,确保您已经激活了相应的虚拟环境,然后在虚拟环境中运行上述命令。
2024-10-08 10:45:21
2308
原创 总结uwsgi+anaconda+django启动遇到的问题
用conda安装uwsgi就可以了。这个应该和conda的环境有关系。这个不行的,安装成功,但是anaconda环境下使用就会出这个问题。不管怎么改配置都报这个错,网上很多解答,但是没有成功的。
2024-09-26 08:57:30
581
原创 python 识别省市、区县并组建三级信息数据库
根据这段源码可看出,在选择 省级的后,网页会调用selectJson接口进行一个post请求,上图可以看到请求的body和header等信息。检查网页源码可以发现: 所有省级信息全部在javaScript下的json中,会在页面加载时加载json数据,填充到页面的option中。注意:部分省有特殊的“直辖县级行政单位”或“自治区直辖县级行政单位”代码执行成功后就可以查到中国所有省市区啦!
2024-09-18 14:29:32
1072
原创 总结中文纠错项目走过的那些坑(pycorrector)
pycorrector: 中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3.8开发。pycorrector实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果。地址:https://kkgithub.com/shibing624/pycorrector/blob/master/README.md
2024-09-13 11:08:10
859
原创 总结python合并两个字典的方法
在大多数情况下,推荐使用{**dict1, **dict2}(如果Python版本是3.5或更高)或dict1.update(dict2)(如果你不介意修改原始字典)来合并两个字典。
2024-09-12 18:23:11
462
原创 总结批量创建文件夹及文件重命名、移动的方法
1、根据一个文件夹的所有文件夹名称,批量创建另一个文件夹,并重命名新的文件夹2、根据提供的数据,获取图片名称,并修改为新的文件名称,保存到json文件中3、根据提供的图片,复制图片到指定文件夹,并重命名图片。
2024-04-19 10:05:33
821
原创 总结mac下解决matplotlib中文显示问题的几种方法
使⽤matplotlib画图时,由于matplotlib默认没有中⽂,显⽰中文时会出现空⽩⼩⽅块。
2024-03-18 10:02:07
1676
3
文件搜索利器 Everything v1.5.0
2024-11-29
文字转语音合成工具 VPot v2411 单文件版( 支持win 7 - 11 )
2024-11-29
一键AI抠图更换背景Digiarty.AIArty.Image.Matting.v2.0
2024-11-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人