知识大胖
这个作者很懒,什么都没留下…
展开
-
使用 Python 构建知识图谱(教程含源码)
这篇文章概述了使用 Python 构建知识图谱的全面方法,重点介绍文本分析技术,例如命名实体识别 (NER)、句法分析和关系提取。它详细介绍了清理和预处理文本、识别关键实体及其关系以及将数据可视化为结构化图的过程。该方法利用 Spacy 等库进行 NER 和大型语言模型 (LLM) 进行关系提取。该文档还提供了用于实现这些技术的代码片段和示例,强调了事件检测和共现分析在生成富有洞察力的知识图谱方面的重要性。最后,它提供了运行脚本以创建和可视化知识图谱的分步指南。原创 2024-09-06 14:02:00 · 368 阅读 · 0 评论 -
使用 Pydeck 可视化 3D 空间数据 如何使用 Python 创建建筑模型图
在本文中,我将向您介绍 Python 包PyDeck,这是一个在 Python 中创建 3D 地图的绝佳工具。作为示例,我将使用覆盖布达佩斯市的 3D 建筑模型数据库。原创 2024-08-26 14:10:52 · 151 阅读 · 0 评论 -
TensorFlow 与 PyTorch:哪个更适合深度学习项目?
深度学习。机器学习的一个子集,利用多层神经网络,也称为深度神经网络。深度学习使社会能够模拟人类大脑所拥有的决策能力,它存在于我们今天生活中使用的一些人工智能应用中。如果您刚开始学习深度学习,您会发现自己对框架的数量感到不知所措。但是,您会看到两个框架位居榜首:PyTorch 和 TensorFlow。这两个框架各有优缺点,都是强大的深度学习工具。PyTorch 为特斯拉的自动驾驶功能和 OpenAI 的 ChatGPT 提供支持,而 TensorFlow 则用于谷歌搜索和优步。TensorFlow 和 Py原创 2024-08-10 00:30:00 · 37 阅读 · 0 评论 -
FastHTML:用 Python 彻底改变 Web 开发
FastHTML 是一个现代的 Python Web 应用程序框架,其真正目的是让 Python 开发人员能够轻松进行 Web 开发。它大大减少了构建交互式可扩展 Web 应用程序对 JavaScript 和 CSS 的依赖。FastHTML 使用 Python 对象来表示 HTML 元素,确保了 Pythonic 和自然的开发体验,同时遵循简单性和可读性的原则。原创 2024-08-08 21:44:29 · 76 阅读 · 0 评论 -
Python 3D系列之 使用 Leafmap 和 MapLibre 轻松实现 Python 3D 功能 MapLibre 与 Leafmap 的新集成
Leafmap 最近发布了与 MapLIbre 集成的 3D 功能。虽然 Leafmap 已经使用 PyDeck 和 Kepler GL 等库提供了 3D 可视化,但 MapLibre 增加了一整套用于创建交互式 3D 地图的全新选项。这意味着您现在可以为您的数据创建更丰富、更具吸引力的可视化效果。原创 2024-07-30 10:32:38 · 47 阅读 · 0 评论 -
如何将 Streamlit 应用程序转换为 .exe 可执行文件? 带有演示的分步教程,用于分享您的 Streamlit 应用程序
最近,我遇到了一个棘手的问题,即开发带有 UI 的数据科学 POC。这其中有什么棘手的呢?只需选择 Gradio 或 Streamlit 并为您的项目构建一个最小 UI。不是吗?连我也是这么想的。但棘手的是,这个 POC 必须与一些非技术银行人员分享,因为他们需要亲身体验该应用程序。要运行任何基于 Python 的应用程序,无论是 Streamlit 还是 Gradio,您都需要进行大量安装,而对于我而言,该应用程序的消费者来说,这些安装是无法完成的。原创 2024-07-15 21:13:35 · 158 阅读 · 0 评论 -
数据分析系列之 03 谁更幸福?使用 Python Streamlit 实现更好的数据可视化 使用 Python Plotly 和 Streamlit 比较加拿大和美国
Streamlit现在是一个使用 Python 进行数据可视化原型设计的流行框架。Streamlit框架节省了时间和精力,并降低了传统上制作地图和图表的复杂性。让我们一起创建四个利用Streamlit进行交互式数据可视化的具体示例:特定年份的数据集的全球分级统计图。多年来的数据集的动画全球分级统计图特定区域的动画分级统计图用折线图来提供数据的另一种表示方式最终目标都是为了回答这个问题:加拿大人是否普遍比他们的美国邻居更幸福(或更不幸福)?让我们来一探究竟!原创 2024-05-31 16:10:13 · 61 阅读 · 0 评论 -
Python Streamlit 和 GPT4:如何绘制联合国难民署难民数据 提示 GPT-4 构建交互式 Streamlit/Plotly 仪表板
Python Streamlit是一个用于创建交互式 Web 界面的出色框架——GPT-4 可以在瞬间生成可用的Streamlit代码。将其与 Python Plotly结合起来进行数据可视化,您就可以以最少的麻烦获得漂亮的地图和图表。像我一样,大多数人都需要证据,所以让我告诉你们如何做。我们可以从 CSV 数据集在 Web 界面中创建多个数据可视化,并添加多层交互(即滑块和下拉菜单)。所有这些都只需一个数据集和一些简单的 GPT-4 提示即可。因此,让我们找到一个数据集并将其付诸行动。原创 2024-05-31 08:35:17 · 139 阅读 · 0 评论 -
代码库到文本:将整个代码项目上下文提供给大型语言模型:将所有代码项目转换为一个文本文件的快速方法,适用于基于 LLM 的上下文或基于 RAG 的应用程序(教程含源码)
将所有代码项目转换为一个文本文件的快速方法,适用于基于 LLM 的上下文或基于 RAG 的应用程序。Codebase -to-Text是一个 Python 包,旨在简化将整个代码库转换为文本格式的过程。通过保留文件的层次结构和内容,此工具使用户能够提取其代码库的全面文本表示。无论是本地项目还是托管在 GitHub 上的存储库,此库都可以简化将代码转换为适合输入 LLM 和 RAG 模型的格式的过程。原创 2024-05-25 13:36:33 · 56 阅读 · 0 评论 -
大模型训练与推理真正需要多少 GPU?(公式含python计算代码)
大型语言模型彻底改变了 NLP 领域,使语言翻译、文本摘要、问答等应用成为可能。这些模型包含数百万甚至数十亿个参数,这些参数是在使用大量数据进行训练时学习的。然而,运行这些模型需要大量的计算资源。在本文中,我们将深入研究运行法学硕士所需的计算要求,探讨影响其复杂性的因素以及对硬件和软件开发人员的影响。您对训练和运行模型所需的计算资源感兴趣吗?请允许我更深入地研究细节👇🏼。原创 2024-05-23 11:08:36 · 470 阅读 · 0 评论 -
使用 Python 代码示例探索大型语言模型 (LLM)
将LLM视为一个巨大的文本和代码库,使用专门的算法在海量数据集上进行训练。这使得它们能够以细致入微的方式理解和响应人类语言,模仿人类交流,甚至生成创造性的文本格式。穿越时空的旅程:对语言理解机器的探索早在人工智能的历史中就开始了。计算能力和深度学习技术的显着进步使法学硕士在 2017 年左右成为人们关注的焦点。GPT-3 和 LaMDA 等模型因其功能而受到了极大的关注。LLM 的闪光点在哪里?内容创作:从撰写营销文案到创作诗歌,法学硕士可以协助生成创意文本内容。原创 2024-05-15 16:23:05 · 131 阅读 · 0 评论 -
将 Llama 3 与 Ollama 和 Python 结合使用 使用 Ollama API 访问这一领先模型
Meta 最近发布的新法学硕士 Llama 3 在人工智能领域引起了轰动。例如,请查看我对下面型号的 70B 版本的评论和测试。在我的测试中,Llama 3 令人印象深刻,但它们是使用聊天界面进行的。如果您想对此模型进行编程以执行有用的任务或使用 Python 创建您自己的模型聊天界面,该怎么办?本文将向您准确展示如何使用 Ollama 来做到这一点。如果您不知道 Ollama 是什么,这是一个允许您在本地下载 Llama 3 等开源模型的网站。原创 2024-05-04 17:57:32 · 1948 阅读 · 1 评论 -
如何使用 Python 创建情感分析模型 创建检测市场情绪的算法
K 最近邻 (KNN) 是一种简单直观的机器学习算法,用于分类和回归任务。但首先,分类和回归是什么意思?分类是一种监督学习,其目标是将数据点分类为预定义的类或标签。在分类中,模型学习根据输入的特征将类或类别分配给输入。分类中的输出是离散的,表示类别或类标签。例如,将电子邮件分类为垃圾邮件或非垃圾邮件。另一方面,回归是一种监督学习,其目标是预测连续数值。在回归中,模型学习建立输入特征和输出(实数值)之间的关系。回归的输出是一个连续的值范围,它表示一个数量或数值。原创 2024-04-14 12:45:20 · 219 阅读 · 0 评论 -
为什么 Python 是人工智能的首要语言:从业者的视角
在快速发展的人工智能 (AI) 领域,选择编程语言至关重要,它不仅充当教学媒介,而且充当创新和效率的催化剂。在众多可用的编程语言中,Python 已成为领跑者,受到新手和经验丰富的从业者的青睐。本文深入探讨了 Python 在人工智能领域突出的原因,讨论了它的简单性、丰富的生态系统和强大的社区支持。原创 2024-04-14 12:41:55 · 41 阅读 · 0 评论 -
使用 Android 模拟器在移动设备上测试您的 Flet 应用程序
使用 Flet 构建移动应用程序时,您可能有时希望在真实设备上测试/预览它。在本文中,我将向您展示如何使用模拟器(虚拟设备)来实现此目的。原创 2024-03-12 15:22:42 · 379 阅读 · 0 评论 -
Python NetworkX教程之使用 NetworkX 和 matplotlib 学习图论,Seaborn数据可视化库(教程含源码)
图论是理解和分析复杂关系和结构的基本框架。从社交网络到交通系统,图表帮助我们建模和研究各种现实世界的现象。在这篇文章中,我们将讨论图和图论的基本概念。请记住,图可以指多种事物,这里将始终使用“图”作为项目之间关系的表示。NetworkX是一个允许表示图的 Python 库。如果您想遵循此迷你指南,则应该安装它。还有其他库,但这个库很容易学习,因此非常适合初学者。本文的目标是使用这个 python 库解释图论的基础知识,这样你就可以学习 2 合 1!原创 2024-03-10 10:39:36 · 461 阅读 · 0 评论 -
Python NetworkX 教程之使用 NetworkX 进行社交网络分析:简要介绍 了解 Facebook 和 LinkedIn 等公司如何从网络中获取洞察
Netflix 等流媒体平台如何推荐适合您晚上观看的完美电影?我们如何优化足球等运动中的球员位置?我们如何识别金融网络中的欺诈活动?我们如何预测 Tinder 等约会应用程序中的匹配情况?所有这些挑战都有相同的解决方案:社交网络分析。社交网络分析 (SNA) 是一个强大的数据科学领域,可以探索实体网络内复杂的关系,发现隐藏的模式并捕获见解。网络实体可以是一切:它们可以是 Instagram 等社交网络上的人、互联网上的网站,甚至是锦标赛网络中的运动队。原创 2024-03-10 09:11:48 · 168 阅读 · 0 评论 -
利用 Apple Silicon GPU 进行深度学习的 3 种方法 Apple Silicon 带来了令人印象深刻的性能提升和极高的能效。我们也可以使用这些芯片进行深度学习吗? 伊日·莫拉夫奇克 走
Apple Silicon 带来了令人印象深刻的性能提升以及出色的能效。但这些芯片也可以用于深度学习吗?绝对地!在本文中,我们将探讨利用 Apple Silicon 的 GPU 执行各种深度学习任务的 3 种方式。原创 2024-03-07 08:39:20 · 93 阅读 · 0 评论 -
数据系列之 05 使用 Python Plotly 增强数据叙述 使用下拉菜单和滑块元素更深入地讲述故事
交互式数据可视化是一种强大的工具,可以显着增强复杂数据集的分析和解释。通过 Python,Plotly 库提供了各种功能,可用于创建交互式出版物质量的图表。本文演示了如何使用其中两个很棒的功能范围滑块下拉式菜单让我们开始吧!原创 2024-02-03 20:40:14 · 120 阅读 · 0 评论 -
数据系列之 03 是什么让数据视觉效果如此出色?八个例子(一年中分手高峰期、NASA 的永久海洋)
这个肯定在互联网上广为流传,所以你可能以前见过它。它的很棒之处在于它使用气泡的大小来显示流量,并使用颜色来显示网站的类别。毫不奇怪,Google 在此排行榜上名列前茅,其次是 YouTube 和 Facebook。这里明显缺少的是 Netflix 和 OpenAI 的数量。仅在 12 月份,OpenAI 就获得了 2B 用户,Netflix 则获得了 1.55B 用户(根据 semrush.com 的数据)。该图表的下一次迭代将反映互联网使用中这些不断变化的模式。原创 2024-02-03 20:28:12 · 78 阅读 · 0 评论 -
数据系列之 02 数据讲故事的应用:四个超级简单的 Python 示例 使用 Python 数据可视化进行数据分析和讲故事
讲数据故事是数据科学家的一项基本技能——将数字与叙述相结合,使数据不那么抽象,更有趣。Python 为学习和练习用数据讲故事提供了一个优秀的平台。任何具有非常基本的 Python 编程技能和良好数据集的人都可以创建漂亮的数据可视化,可用于通知和解释。国家级趋势分析——阿富汗识字率比较分析——美国 vs 印度全球趋势分析——按十年划分的全球平均识字率当前全球识字率— 当前全球识字率的热图快照让我们一起创建 Python 代码来可视化这些分析,然后查看结果以了解它们讲述了什么故事。原创 2024-02-03 17:04:21 · 83 阅读 · 0 评论 -
数据系列之 01 数据视觉展示的艺术:减少认知负荷的两种简单方法 两种减少认知的方法来指导我们的数据视觉设计
人类并不真的想思考——除非他们必须这样做。如果你处于必须思考的位置,它会显着减慢你对正在查看的信息的处理速度。当您向观众展示新的复杂数据可视化时,请记住这一点非常重要。杂乱的展示肯定会迫使大部分观众不得不放慢速度思考。如果他们必须这样做,那么他们将不再听你的。正如丹尼尔·卡尼曼(Daniel Kahneman)(在他的《思考快与慢》一书中指出的那样),当一个人必须放慢速度并处理他们所看到的事物时,就会迫使他们从系统 1 思维(无意识的自动反应)转向系统 2 思维(慢速思考)。原创 2024-02-03 16:58:13 · 77 阅读 · 0 评论 -
数据到仪表板:利用 GPT-4 提示绘制联合国粮食安全统计数据 使用 GPT-4 和 Plotly dash 进行交互式粮食安全绘图
最近,GPT-4 对 Python 代码生成的提示有了显着改进。特别是像 Plotly dash 和 Streamlit 这样的交互式库。这包括提示生成交互式数据可视化,例如等值线图和散点地理(气泡)图。等值线图是专题地图的一种风格,其中区域的阴影或图案与所使用的数据点成比例(即代表相对全球安全性的值)散点地理(气泡)地图使用不同大小的圆圈来表示领土上的数值(例如,每个国家一个气泡)。这两个地图都可以使用 Python Plotly 库创建。原创 2024-02-01 08:48:02 · 110 阅读 · 0 评论 -
使用比较视觉效果:Python Plotly 的 3 个实践示例 数据的价值往往在于其可比性——Tufte
世界充斥着数据,将这些信息转化为可理解的数据可视化是一个艰难的过程。Edward Tufte 是数据可视化领域的先驱,他的整个职业生涯都致力于将复杂的信息提炼成清晰、富有洞察力的视觉效果。在塔夫特看来,数据很少存在于真空中。与其他数据相比,它可能最有意义。数据的价值往往在于其可比性。通过明确比较,观众可以更好地看到数据集之间的差异和相似之处。我们怎样才能明确?使用联合国全球数据集,让我们看一下 3 个很棒的 Python 示例:比较条形图、折线图和分区统计图热图。原创 2024-02-01 08:39:58 · 86 阅读 · 0 评论 -
GPT-4 制图的成熟:处理复杂的 GIS 数据查询 使用 Pythonplotly 和 dash 创建地图的模块化方法
Python 中的数据可视化工具是出了名的挑剔。有了触手可及的生成式人工智能,我们可以要求 GPT-4 为我们简化流程。最近,它似乎在处理大型 CSV 文件以进行数据可视化方面做得更好了为了检验这个理论,今天我重新审视我在 2023 年 4 月写的一个故事——由于 GPT-4 当时的挑剔性质,这个故事花了我很长时间(有很多麻烦)来写。这篇文章基于我在 LinkedIn 上查看的静态地图,该地图基于 NASA 的数据,显示了某个地区一段时间内的森林火灾。原创 2024-02-01 02:45:00 · 187 阅读 · 0 评论 -
数理实验之 评估机器学习中的聚类 关于无监督聚类的原因、方式和内容的指南(教程含源码)
聚类一直是引起我关注的主题之一。尤其是当我第一次进入机器学习的整个领域时,无监督聚类总是对我有吸引力。简而言之,集群就像机器学习中穿着闪亮盔甲的无名骑士。这种形式的无监督学习旨在将相似的数据点捆绑成组。想象一下你自己在一个社交聚会中,每个人都是陌生人。你会如何解读人群?或许,可以根据共同特征对个人进行分组,例如那些因笑话而大笑的人、深入交谈的足球爱好者或被文学讨论所吸引的人。简而言之,这就是聚类!您可能想知道,“为什么它相关?集群拥有众多的应用。原创 2024-01-22 09:21:10 · 36 阅读 · 0 评论 -
数理实验之 线性回归与泊松回归 了解适合您数据的工具(教材含源码)
线性回归算法也许是我们学习的第一个机器学习算法,它无疑是最基本和最常用的技术之一,尤其是在预测分析方面。线性回归的主要好处在于它的简单性并且可以很容易地实现。简单意味着算法也具有高度可解释性。本质上,线性回归试图通过将线性方程拟合到观察到的数据点来对给定数据集进行建模。因此,这里的关键概念是线性。假设我们的特征(可以是一个或多个)与某个目标之间存在线性关系。在哪里:y是因变量(我们试图预测的结果)。x1, x2, …, xn是自变量(预测变量)。原创 2024-01-22 09:15:10 · 65 阅读 · 0 评论 -
从头开始编码Stable Diffusion(教程含源码)
从头开始构建稳定扩散是可能的,您将在本博客中看到这一点,但由于需要大量数据和计算,实现市场上现有的质量(类似于Stability AI 的构建方式)具有挑战性。正如今天您可以构建一个百万参数的 LLM(如我的一篇博客中所示) ,将其扩展到十亿个参数(如Mistral或Meta等公司所做的那样),需要同样强大的计算和广泛的数据资源。在这篇博客中,我将尝试从头开始创建一个小规模的稳定扩散类模型。这里的小规模意味着我们将使用您可能听说过的小型数据集MNIST。原创 2024-01-20 21:10:01 · 498 阅读 · 0 评论 -
使用 Python 从头开始构建百万参数 LLM ,复制 LLaMA 架构的分步指南
创建自己的大型语言模型 (LLM) 是一件很酷的事情,许多大公司(例如 Google、Twitter 和 Facebook)都在做。他们发布了这些模型的不同版本,比如 70 亿、130 亿或 700 亿。甚至较小的社区也在这样做。您可能已经阅读过有关创建自己的法学硕士的博客或观看了视频,但他们通常会谈论很多理论,而不是谈论实际的步骤和代码。在这篇博客中,我将尝试创建一个只有 230 万个参数的 LLM,有趣的是我们不需要花哨的 GPU。我们将遵循LLaMA 1 论文方法来指导我们。不用担心;原创 2024-01-20 17:09:40 · 169 阅读 · 0 评论 -
数学如何帮助我们理解意识 有没有一种方法可以量化和建模意识、感受、思想和自我的现象?
意识是人类存在中最神秘、最迷人的方面之一。它也是科学研究中最具挑战性的领域之一,因为它涉及无法直接观察或测量的主观体验。纽约大学哲学和神经科学教授 David Chalmers 在他的著作《意识思维》中提到,“这可能是我们寻求科学理解宇宙过程中最大的障碍。真正的问题是:我们如何才能从严谨、客观的角度来处理意识问题?有没有一种方法可以量化和建模意识、感受、思想和自我的现象?这个问题没有明确的答案,但一些研究人员尝试使用数学工具和方法来研究这些现象。原创 2024-01-20 10:39:48 · 54 阅读 · 0 评论 -
赋能知识图谱形成:利用 BERTopic、DataMapPlot 和 Mistral AI 揭示见解(教程含完整代码)
BERTopic:动态主题建模框架: BERTopic 证明了主题建模的发展,提供了一个灵活的模块化框架,可以适应各种用户需求。其模块化架构使用户能够构建适合其特定需求的主题模型,有效地与语言人工智能的最新进展保持一致。BERTopic v0.16 的发布引入了变革性功能,例如零射击主题建模、模型合并以及对大型语言模型 (LLM) 的增强支持。DataMapPlot:简化的数据可视化: DataMapPlot 是对 BERTopic 的补充,简化了视觉上引人注目的数据地图的创建。原创 2024-01-08 15:01:06 · 2233 阅读 · 0 评论 -
数据分析之水质和饮用水 ,基于Scikit-Learn 逻辑回归(教程含数据与源码)
我们正在查看一个数据集,其中每个样本都包含不同的特征,例如 pH 值、硬度以及不同的矿物质和化合物。以下相关矩阵显示,没有与可饮用性具有非常高相关性的明确预测特征。该数据集包含有关水质和饮用水的信息。我们的技术重点是 scikit learn 中的逻辑回归 [3]。我们使用 LogisticRegression 中可用的类权重自动平衡来考虑到与饮用水相比,非饮用水样本较多。逻辑回归算法是一种线性分类器。我们分割数据集并根据上面的代码训练逻辑回归模型。得到的混淆矩阵包含许多假阴性和假阳性。原创 2024-01-07 11:28:18 · 371 阅读 · 0 评论 -
数据分析之瑞士施维茨州的建筑物供暖 ,基于seaborn barplots(教程含源码)
正如我们所看到的,石油是坎顿施维茨州建筑物的主要能源。这是一种经常在偏远地区使用的能源,因为可以通过卡车进行配送,并且不需要管道。下一个流行的加热源是木材,它可以被认为是可再生的。天然气的相关性较小,并且可能在较大的城镇中使用更多。电既可以对应老式的电加热,也可以对应现代的热泵。目前尚不清楚该功能名称在这里指的是什么。该数据集提供有关坎顿每个县注册的建筑物数量的信息。它包含有关坎顿施维茨州建筑物中使用的供暖类型的信息(按县分组)。我们使用plotly来显示瑞士的地形图并标记数据集中建筑物的平均位置。原创 2024-01-07 11:21:39 · 902 阅读 · 0 评论 -
数据分析之全球食糖消费量, 基于Pandas 和Cartopy(教程含数据与源码)
本周,我们将关注全球食糖消费量。本周我们的技术重点是 cartopy shapereader。原创 2024-01-04 11:05:05 · 400 阅读 · 0 评论 -
零售分析:每个数据专业人员都应该了解的 16 个重要概念
零售业是一个动态且快速发展的生态系统。每次点击、每次滑动和每次购买都会生成数据流。但是,将海量数据转化为零售商可操作的见解背后的魔力是什么?答案是:零售分析。在本博客中,我们将了解每个数据专业人员都应该熟悉的零售分析的所有关键概念。无论您是一名有抱负的数据科学家、数据分析师、从事零售业务,还是只是对购物体验背后的秘密感到好奇,本指南都适合您。那么,让我们从 16 个最重要的概念开始,了解数据如何重塑零售世界。原创 2024-01-04 08:45:45 · 816 阅读 · 0 评论 -
精品数学系列之欧拉公式的一些惊人应用(教程含python源码)
欧拉公式是将复数与三角学联系起来的简单表达式。事情是这样的:!因此 cosθ 是恒等式的实部,而 sinθ 是虚部。使用欧拉公式,可以非常简单地用复指数来表达标准三角比,例如,注意到 cos(-θ) = cosθ 和 sin(-θ) = -sinθ,我们可以说。原创 2024-01-01 08:30:56 · 375 阅读 · 0 评论 -
使用 ReactPy 构建全栈 AI 应用程序 学习如何使用 React 在 Python 中构建漂亮的 UI!
迄今为止,有许多数据科学家想要学习成为全栈技能。了解如何(即使是最低限度)独立创建一个由后端和前端组成的简单应用程序是非常有用的。迄今为止,在人工智能领域,使用 Streamlit 和 Gradio 等工具开发前端是非常流行的。今天,我们还有 ReactPy,一个新生的库,它还不允许我们做伟大的事情,但它绝对是一个值得关注的库,因为我确信它会被越来越多地使用,并允许我们创建为必须使用我们的人工智能模型的用户提供出色的用户体验!原创 2023-12-07 14:33:42 · 368 阅读 · 0 评论 -
如何使用 Python 构建简单的 OCR 搜索应用程序 使用 Python 自动对您自己的图像进行文本搜索(教程含完整源码)
光学字符识别 (OCR) 是一项流行技术,旨在将不同类型的文档转换为可编辑和可搜索的数据。从扫描文档到文档照片,OCR 可以成为提取文本并帮助自动化数据提取过程的有效工具。Python 是最通用的语言之一,拥有各种执行 OCR 的库。在本文中,我们将探索一个使用该easyocr库对本地图像文件执行 OCR 的 Python 脚本。原创 2023-10-02 06:53:34 · 89 阅读 · 0 评论 -
使用 Tkinter 掌握 Python GUI 开发 使用 Python 构建用户友好的文档生成器 GUI 的分步指南(教程含源码)
然后,您定义一个名为的函数create_gui,该函数将创建图形用户界面。创建三个StringVar变量来存储输入文件夹、Excel 文件和输出文件夹的输入。原创 2023-10-02 06:43:14 · 62 阅读 · 0 评论 -
使用 Python 构建自动文本摘要器的分步指南
要进行英语文本摘要,我们可以使用sumy的帮助。但是,google colab没有sumy库。因此,我们需要先安装sumy库,如下所示。!注意:Sumy只能用于总结英文文本。然后,我们导入将在文本摘要过程中使用的库。这是我们将在使用 python 的文本摘要过程中使用的文档示例。"""之后,我们查看文档的长度。len(text)接下来,我们将每个单词分成标记。每个单词都会被评分,然后重新组合成原始句子,并将分数相加。得分最高的句子将包含在汇总结果中。以下是使用sumy库的摘要结果。原创 2023-10-01 20:41:15 · 141 阅读 · 0 评论