- 博客(38)
- 资源 (1)
- 收藏
- 关注
原创 技术拾贝 | 最简单的一个flask程序
这个示例展示了 Flask 最核心的路由和响应功能,是学习 Flask 框架的起点。启动 Flask 内置的开发服务器(默认端口 5000)装饰器定义路由,指定 URL 路径(这里是根路径)视图函数,处理请求并返回响应(简单的字符串),你会看到 "Hello, World!导入 Flask 框架的核心类。创建 Flask 应用实例,用于确定应用的根目录。
2025-04-07 20:29:02
309
1
原创 技术拾贝 | python装饰器介绍
的重要工具,广泛应用于 Web 框架(Flask/Django)、测试、日志、缓存等场景。(函数或类),它接受一个函数作为输入,并返回一个新的函数(或类)。装饰器本身是一个函数,它接收一个函数(被装饰的函数)作为参数,并返回一个新的函数(通常称为。Python 自带了一些常用的装饰器,通常用于特定的功能增强或元编程。(即接收函数作为参数并返回函数),通过。方法使其可调用,从而装饰目标函数。装饰器也可以是一个类,通过实现。如果装饰器本身需要参数,则需要。是一种特殊的函数或类,用于。装饰器是 Python。
2025-04-07 20:28:38
317
原创 随想 | 被AI盯上的office工程师:自动化工具如何重构办公价值链条?
在日常办公中,接触最多的是和,尤其是大量的数据清洗、分析与可视化工作。自从这类AI工具出现后,深刻感受到人工智能的强大,甚至在通勤的班车上也不禁思考未来办公方式的变革。
2025-04-03 09:47:10
360
原创 技术拾贝 | 一键提取PPT全文档文字与形状属性(颜色/尺寸/坐标)
功能限制:对于组合形状(Group Shapes)中的文本和属性,目前暂不支持提取。支持提取幻灯片中的所有文本内容(包括普通文本框、表格内文字以及分组形状中的文本)格式要求:仅支持.pptx格式(Office 2007及以上版本)单位标准:位置信息统一以厘米(cm)为单位返回。以行列结构返回表格数据,保留原始表格组织形式。返回厘米为单位的精确位置和尺寸信息。返回按幻灯片页码组织的文本集合。精确定位包含特定文本的形状坐标。自动识别PPT中的表格元素。支持多表格幻灯片处理。
2025-04-01 11:15:47
278
原创 虫洞数观系列三 | 数据分析全链路实践:Pandas清洗统计 + Navicat可视化呈现
本方案构建了一套高效的数据分析及可视化工作流:基于Pandas实现核心数据处理与分析,通过Navicat进行可视化呈现。Navicat支持将动态仪表板直接导出为PDF报告,实现了企业数据报表的自动化生成与更新。该方案有效解决了传统PPT汇报中数据维护成本高、时效性差的痛点,能够确保管理层始终获取最新业务洞察,显著提升决策效率。
2025-04-01 09:00:15
959
原创 虫洞数观系列二 | Python+MySQL高效封装:为pandas数据分析铺路
本文提出了一套高效的MySQL-DataFrame交互解决方案,针对传统数据库操作中存在的代码冗余、转换效率低等问题,设计了基于三层架构的标准化接口。该方案通过元数据层(dbname.py)实现表结构声明式配置,在数据访问层(mysql_dao.py)封装六大核心方法,支持连接池管理、自动列名映射和5000行/批的智能分块处理。实际应用表明,该方案特别适用于需要频繁在数据库和DataFrame之间进行数据转换的分析场景。
2025-03-31 19:00:57
863
原创 虫洞数观系列总览 | 技术全景:豆瓣电影TOP250数据采集→分析→可视化完整指南
使用Requests库模拟浏览器请求,BeautifulSoup库解析HTML页面,提取电影名称、评分、评论人数、导演、主演、类型、上映时间、片长等信息。从零开始,手把手带你完成一个完整的电影数据分析项目,涵盖数据采集、处理、存储、分析和可视化展示全流程。使用ECharts等图表库,将电影数据以柱状图、饼图、折线图等形式进行可视化展示。使用Pandas库对数据进行清洗,处理缺失值、重复值、格式不一致等问题。设计RESTful API接口,提供电影数据查询、筛选、排序等功能。数据大屏, 交互式图表。
2025-03-25 11:34:00
795
原创 虫洞数观系列一 | 豆瓣电影TOP250数据采集与MySQL存储实战
通过网盘分享的文件:项目工坊_豆瓣爬虫链接: https://pan.baidu.com/s/1cY8plsXfVYl8NuhBixVrTQ?pwd=y131 提取码: y131。
2025-03-25 11:31:43
1998
原创 知识周汇 | 用 matplotlib 轻松绘制折线图、散点图、柱状图、直方图
matplotlib是 Python 中最常用的绘图库之一,无论是数据分析还是科研绘图,它都能轻松搞定。今天我们就来学习如何使用matplotlib折线图散点图柱状图和直方图和组合图(柱状图和折线图),并重点讲解组合图。
2025-03-24 10:45:01
1139
原创 知识周汇 | NumPy 数据处理与科学计算指南:基础知识
我们经常能接触了解到3个概念列表、array数组NumPy数组,以下是这3类的区别特性Python 列表 (listarray模块NumPy 数组 (数据类型可以存储任意类型的数据只能存储同类型的数值数据只能存储同类型的数值数据内存效率较低较高高数值计算支持不支持基本支持支持高效的数值计算多维数组支持不支持不支持支持灵活性高低中等适用场景通用数据存储高效存储同类型数值数据科学计算、数据分析本文聚焦 NumPy 的讲解。
2025-03-24 10:01:28
1031
原创 避坑指南 | 阿里云服务器centos7上MySQL部署优化指南
总结来说,这段话详细描述了如何通过下载并安装MySQL的Yum仓库RPM包,将MySQL的官方仓库添加到系统中,以便后续通过Yum安装或管理MySQL。表示默认启用的MySQL版本(这里是MySQL 8.4),其他版本(如MySQL 8.0和MySQL Innovation系列)默认是禁用的。这段话主要讲解了如何将MySQL的Yum仓库添加到系统的仓库列表中,以便通过Yum包管理器安装或更新MySQL。可以使用以下命令来验证MySQL Yum仓库是否已经被成功添加到你的系统中,并且已经启用。
2025-03-21 15:38:33
806
原创 避坑指南 | opencv-python imread读取路径错误
最近在学习opencv的cv2.imread,很简单的一个用法cv2.imread,运行一下代码报错误。
2025-03-12 08:37:56
816
原创 项目工坊 | Python驱动淘宝信息爬虫
Selenium作为主流的Web自动化测试框架,在数据采集领域也有广泛应用。本文将分享如何使用Selenium实现淘宝物资价格信息的爬取。目前代码还存在一些缺陷,主要体现在:1)未能有效绕过淘宝的反爬虫机制;2)登录环节仍需人工干预。欢迎大伙在评论区分享解决方案。TaoBao这段代码通过Selenium模拟浏览器操作,实现了从淘宝网站抓取商品信息的功能。代码中使用了多种反爬虫技术,避免被网站检测为自动化脚本。最终,抓取到的商品信息被保存到Excel文件中,便于后续分析和处理。
2025-03-11 12:49:59
855
2
原创 技术拾贝 | python中map用法
map()是 Python 中一个强大的工具,用于将函数应用于可迭代对象的每个元素。它的主要特点包括:支持单个或多个可迭代对象。可以与lambda函数和内置函数结合使用。返回一个迭代器,适合处理大规模数据。map()和列表推导式可以根据需求选择使用,前者更适合函数式编程风格,后者更适合直观的列表生成map()是 Pandas 中用于Series的逐元素操作函数,适合简单的值替换或映射。总之,map()是 Python 中不可或缺的工具之一,熟练掌握其用法能够显著提升编程效率和代码质量。
2025-03-10 09:48:40
1424
原创 知识周汇 | Python操作Excel全攻略系列(五):格式美化篇
本文是系列文章的延续,将聚焦于Excel表格的格式美化操作,涵盖边框设置、字体调整、对齐方式优化、行高与列宽调节、首行颜色填充以及交错颜色设置等实用技巧。的延续,聚焦于 Excel 表格的格式美化操作,涵盖边框设置、字体调整、对齐方式优化、行高与列宽调节、首行颜色填充以及交错颜色设置等实用技巧。:该函数用于获取指定Excel文件中指定工作表的最大行数、最大列数以及工作表的名称。:获取指定Excel文件中指定工作表的最大行数、最大列数以及工作表的名称。
2025-03-08 12:00:31
1089
原创 知识周汇 | Python操作Excel全攻略系列(四):单元格相关篇
定义了一个名为excel_url:Excel文件的路径。sheetnum:工作表的索引,默认值为0(即第一个工作表)。sheetname:工作表的名称,默认值为空字符串。定义了一个名为excel_url: Excel 文件的路径或 URL。assign_str: 需要查找的目标字符串。sheetnum: 工作表的索引,默认值为0(即第一个工作表)。sheetname: 工作表的名称,默认值为空字符串。函数的返回值是目标字符串首次出现的位置所在的行号和列号(从 1 开始计数),如果未找到目标字符串,则返回。
2025-03-07 10:31:40
1028
原创 知识周汇 | Python操作Excel全攻略系列(三):sheet操作篇
本文详细探讨了Excel中Sheet表的相关操作,主要包括以下几个方面:Sheet表信息的获取(如Sheet表数量及其命名)、Sheet表的复制、Sheet表内容的清空、Sheet表中插入N行数据、特定行的删除,以及首行冻结。其中,Sheet表信息的获取尤为重要,因为Excel表作为数据分析的主要载体,在不打开Excel表的情况下,了解Sheet表的数量及其命名信息至关重要。:工作表的名称(如果指定,则优先使用名称定位工作表)。:工作表的名称(如果指定,则优先使用名称定位工作表)。
2025-03-06 13:21:36
1536
原创 知识周汇 | Python操作Excel全攻略系列(二):文件操作篇
excel_url = '新建XLSX工作表.xlsx'excel_url是 Excel 文件的路径和名称。这里使用的是相对路径,文件名为新建XLSX工作表.xlsx。''':param excel_url: 处理excel表文件:return: 返回sheet个数和sheet名字'''功能:读取 Excel 文件,返回文件中 Sheet 的数量和所有 Sheet 的名称。参数excel_url:Excel 文件的路径。返回值sheetnum:Sheet 的数量。:所有 Sheet 的名称列表。
2025-03-05 13:28:36
1073
原创 技术拾贝 | 遍历符合后缀的文件
通过os模块用于遍历指定路径下的所有文件,筛选出符合指定后缀名的文件,并返回它们的完整路径列表完整代码import os"""遍历指定路径下的所有文件,筛选出符合指定后缀名的文件,并返回它们的完整路径列表。:param path: 需要遍历的根目录路径:param suffixes: 需要匹配的文件后缀名元组,默认为 ('.x', '.X', '.X1'):return: 包含所有符合条件的文件路径的列表"""all_file_urls = [] # 存储符合条件的文件路径。
2025-03-05 09:05:18
224
原创 知识周汇 | Python操作Excel全攻略系列(一):模块详解篇
作为现代职场不可或缺的利器,Excel以其卓越的数据处理能力,稳居办公软件使用率之首。无论是面对海量数据的深度分析与整理,还是实现业务信息的系统化收集与管理,亦或是打造专业精准的报表体系,Excel始终扮演着无可替代的关键角色。本系列教程旨在系统化地讲解Python操作Excel的核心技能,精心规划为五大专题:模块详解篇、文件操作篇、工作表掌控篇、数据处理篇以及格式美化篇。
2025-03-05 08:48:17
958
原创 知识周汇 | MySQL增删改查与Python连接
MySQL 是用于存储数据的核心工具,正如掌握列表和字典一样,熟练掌握其最基本的增删改查操作是必不可少的。此外,学会用 Python 连接 MySQL 更是关键一步,它意味着我们可以直接访问服务器中的数据,并借助 Pandas 实现自动化分析,这无疑是数据分析中的重要环节。MySQL 是数据存储和管理的核心工具,熟练掌握其增删改查操作是数据分析的基础。通过 Python 连接 MySQL,可以实现自动化数据访问和处理,极大地提高数据分析的效率。
2025-03-03 12:06:07
848
原创 技术拾贝 | python中sored用法
sorted()是 Python 中的一个内置函数,用于对可迭代对象(如列表、元组、字典等)进行排序{'排序标记': 'C', 'name': 'item3'},{'排序标记': 'A', 'name': 'item1'},{'排序标记': 'D', 'name': 'item4'},{'排序标记': 'B', 'name': 'item2'}
2025-03-03 10:09:23
301
原创 技术拾贝 | df.at[]和df.iat[]是dataframe高效访问或修改单个值的方法
df.at[]和df.iat[]是 Pandas 中用于访问或修改 DataFrame 中单个值的方法。dataframe四种使用方式对比方法索引方式返回结果适用场景df.at[]行标签 + 列标签单个值精确访问或修改单个值df.iat[]行位置 + 列位置单个值精确访问或修改单个值df.loc[]行标签 + 列标签单个值、切片基于标签的访问或修改df.iloc[]行位置 + 列位置单个值、切片基于位置的访问或修改dataframe四种访问性能对比数据量(访问位置[10000,5])
2025-02-28 06:57:46
315
原创 知识周汇 | SAP脚本自动化-淋过雨的人更懂得伞的价值
在许多企业中,核心业务数据通常存储在SAP系统中,且仅限内网访问以确保数据安全。然而,传统的手动操作方式,如逐条输入指令和频繁点击界面,不仅效率低下,还容易出错,给办公人员带来了极大的负担。为了解决这一问题,本文通过SAP GUI脚本模拟人工操作,实现数据下载的自动化。这种方法不仅显著提升了操作效率,还减少了重复性工作,从而大幅提高了办公人员的幸福度。这篇文章是我一直想写的。过去几年部门业务调整后,SAP成为日常工作的核心,手动操作效率低下。
2025-02-28 06:56:29
1359
原创 技术拾贝 | Python 实现 PDF 文字水印的自动化添加
本文介绍如何使用 Python 为 PDF 文件添加文字水印,适用于多部门专属水印生成场景,助力文档安全与溯源。
2025-02-27 11:49:03
658
原创 技术拾贝 | os.remove清空文件夹里面指定后缀文件
os.remove是 Python 中用于删除文件的标准库函数,属于os模块。它的作用是删除指定路径的文件。如果文件不存在或路径指向一个目录,则会抛出异常。在工作中,清空文件夹是一个常见操作,但需要谨慎使用上述代码,因为运行后文件将被永久删除,无法恢复。
2025-02-27 09:05:00
377
原创 技术拾贝 | df.iloc[]是dataframe基于整数位置的索引方法
df.iloc[]是 Pandas 中基于整数位置的数据选择方法,用于通过行和列的索引位置(从 0 开始)来访问或操作 DataFrame 中的数据。方法索引方式示例行索引输入类型列索引输入类型df.iloc[]基于整数位置的索引(从 0 开始:第 1 行第 2 列整数、整数列表、切片、布尔数组整数、整数列表、切片、布尔数组df.loc[]基于标签的索引(行标签和列名):行标签为 0,列名为A标签、标签列表、切片、布尔数组列名、列名列表、切片、布尔数组。
2025-02-27 08:37:25
390
原创 技术拾贝 | df.loc[]是dataframe基于标签的索引方法
df.loc[]是 Pandas 中用于基于标签(label-based)选择数据的索引方法dataframe基于标签的索引df.loc[]能够灵活地处理行和列的标签索引,非常适合需要对数据进行精细化操作的场景。
2025-02-26 08:44:31
367
原创 技术拾贝 | 函数pd.to_datetime
是 Pandas 中用于将输入转换为datetime对象的函数。pd.to_datetime是 Pandas 库中用于处理时间戳的核心函数,熟练掌握它将显著提升数据处理效率。
2025-02-26 08:16:02
436
原创 项目工坊 | 技术流玩法!用Selenium解锁CSDN文章阅读量新姿势
对于初入CSDN的博主而言,看到他人文章的高阅读量往往令人心生羡慕。本文将引导读者学习并掌握Selenium的基本操作规则,并巧妙运用这一工具自动浏览您在CSDN平台上的文章,从而有效提升文章的阅读量。
2025-02-25 16:16:36
339
原创 项目工坊 | 高效自动化:Python-pptx生成ppt全流程详解(呕心沥血版)
本文详细介绍了如何利用 Python 的 python-pptx 模块来自动化生成 PowerPoint 报告。文章通过一个具体的案例,展示了如何从零开始构建一个自动化生成 PPT 的工具,涵盖了从安装模块、PPT 结构分析、基础操作(如新建 PPT、添加幻灯片、插入文本框、形状、图片、表格和图表)到最终生成完整报告的整个过程。
2025-02-25 11:00:25
2593
2
原创 知识周汇 | Mysql和Navicat安装教程
这些数据库是 MySQL 系统自带的,请勿随意修改或删除,以免影响数据库的正常运行。:用于存储系统相关的视图、存储过程和函数,帮助用户监控和优化数据库性能。:存储 MySQL 服务器的核心数据,包括用户权限、日志信息等。:用于收集数据库性能相关的数据,帮助分析和优化性能。:提供数据库元数据的访问,如表、列、索引等信息。上述Navicat是绿色版本解压即可使用。
2025-02-23 14:06:07
370
原创 知识周汇 | Python 中文件夹、包、模块定义及函数或类模块引用
定义:文件夹是操作系统中的目录,用于组织文件和子目录。作用:在 Python 中,文件夹可以用来组织包和模块。特点:如果文件夹中包含文件,则它被视为一个包;如果文件夹中不包含文件,则它只是一个普通的文件夹,Python 不会将其视为包。
2025-02-23 09:49:17
275
原创 知识周汇 | PyCharm与Anaconda下载安装及PyCharm新建项目指南
安装 Anaconda 的主要优势在于它预装了大量的常用库,因此在 PyCharm 中新建项目时,可以直接调用这些库,省去了手动安装的麻烦。以下是我的 PyCharm 已激活版本,具体的激活在上述百度网盘链接中有陈述。等待安装结束后,安装插件中文插件、主题:Chinese(Simplified) Language Pack/中文语言包、Material Theme UI,然后重启pycharm即可。修改安装目录,一般安装在D盘,然后点击next。双击安装包,点击next。全部打钩,点击Next。
2025-02-22 21:05:42
411
原创 项目工坊 | Python代码变形记:一个简单案例的N次重构,函数与类的华丽转身
本文以Python设计初中计算题为例,首先采用过程式编程方法,从零开始完整实现代码脚本,随后循序渐进地引入函数和类进行优化重构。与网络上常见的一开始就堆砌大量专业术语的文章不同,本文通过具体示例,自然流畅地从过程式编程过渡到面向对象编程,使读者能够清晰地理解编程范式的演进过程。
2025-02-21 15:32:43
1039
1
原创 项目工坊 | 效率提升N倍!Python实现Excel VLOOKUP的四种方法对比
本文总结了使用Python实现Excel中VLOOKUP功能的多种方法,并对各方法的效率进行了对比分析。:输入两个Excel表格(表A和表B),并将其加载为Pandas的DataFrame对象;:基于关键列对两个表格进行匹配操作;:将匹配结果保存到新的Excel表格中。在第二步中,本文重点对比了四种实现方法:(1):通过嵌套循环依次遍历两个DataFrame,逐行对比关键列的值;(2):将其中一个DataFrame转换为字典,利用字典的快速查找特性与另一个DataFrame进行对比;(3)
2025-02-18 08:53:53
1386
原创 知识周汇 | Python 数据存储利器:列表与字典,解锁高效编程!
任何一种语言,都得先了解最基础的数据结构。python中最常用的数据结构就是列表和字典,灵活使用它们能事半功倍。
2025-02-13 12:01:50
379
原创 知识周汇 | 掌握 DataFrame 核心操作,轻松玩转数据分析
dataframe结构在数据分析中用的最多的一种结构,参照平时处理excel表基本用到的操作也是拼接、去重、排序、筛选等,本文章对数据处理创建dataframe、对dataframe常规操作、数据清洗、拼接、排序进行介绍。
2025-01-16 10:57:21
2425
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人