- 博客(64)
- 收藏
- 关注
原创 数据分析笔记15:Python模块、包与异常处理
本文系统介绍了Python模块化编程与异常处理的核心知识。主要内容包括:1)模块基础理论,解析模块定义、优势及5种导入方式;2)标准库模块应用,详解math、time、random等模块功能;3)自定义模块开发流程,重点说明命名规范与__name__机制;4)第三方模块管理策略,对比pip安装与镜像源加速方法;5)包的组织结构,阐述创建方法与3种导入策略;6)异常处理体系,涵盖语法结构、特定异常捕获及finally子句等高级应用。文章通过典型代码示例和工程实践案例,展现了模块化设计与异常处理在提升代码复用性
2025-12-26 15:39:51
679
原创 从 GitHub Copilot 到 Claude Code:AI 编码的 3 年演变之旅
AI编码工具三年演变:从补全到自治 过去三年,AI编码经历了三个关键发展阶段: 2022-2023:GitHub Copilot开创智能补全时代,虽不完美但展现潜力 2024:Cursor等工具实现功能级构建,引发"氛围编码"热潮 2025:ClaudeCode突破终端自治,完成编码-测试-调试全流程 核心转变:开发者角色从代码编写者转向架构决策者。AI解决了实现问题,但产品判断、架构决策等仍需人类经验。当前关键已从"AI能否编码"转为"如何适应新工作模式&
2025-12-08 19:28:46
1046
2
原创 打造完美的配图 - Eagle Backdrop Generator 批量背景添加插件全面指南
EagleBackdropGenerator是一款专为设计师和内容创作者开发的Eagle原生插件,旨在3秒内将普通图片转变为专业展示图。核心功能包括3种精选渐变预设、6种主流比例适配、批量处理能力以及实时预览效果。该插件采用高性能本地处理技术,保护用户隐私,支持JPG/PNG/WebP格式。未来将推出自定义渐变编辑器和AI推荐等增强功能。目前完全免费,帮助用户提升作品展示的专业性,节省图片处理时间。
2025-11-17 21:11:22
2176
原创 数据分析笔记14:Python文件操作
本文介绍了Python文件操作中的编码基础理论和文件管理方法。主要内容包括:1)编码原理(ASCII、GBK、UTF-8等编码表的特点及转换方法);2)文件路径管理(绝对/相对路径的选择与处理);3)文件读写操作(open函数的模式选择、read/readlines/readline等方法对比);4)实用技巧(with语句自动管理文件、转义字符处理);5)应用示例(用户登录验证系统和名片管理系统的实现)。重点强调了编码一致性、绝对路径使用和with语句的最佳实践,为Python文件操作提供了全面的理论基础和
2025-11-17 16:29:06
752
1
原创 数据分析笔记13:Python 名片管理系统-练习案例
Python名片管理系统项目实现了基于控制台的简易名片管理功能,包含新建、显示、查询和删除名片等核心功能。系统采用列表存储字典的结构管理数据,通过函数式编程实现模块化设计。主函数run()作为控制中心协调各功能模块,同时实现了用户交互界面和循环操作机制。当前版本数据仅保存在内存中,程序关闭后丢失,为后续文件存储操作预留了扩展接口。该系统展示了Python基础数据类型、流程控制和函数封装等核心概念的应用,适合作为Python初学者的实践案例。
2025-11-17 16:27:29
469
原创 数据分析笔记12:函数
文章摘要:本文重点介绍了Python函数的概念与应用,包括函数的作用、定义与调用方法、参数传递方式(位置传参和关键字传参)、返回值机制以及函数嵌套调用。通过实际案例分析了函数的优势,如减少代码冗余、提高可维护性和开发效率。特别强调了正确阅读代码的方法:应先看函数调用处理解程序流程,再查看具体实现。最后还探讨了函数在统计学中的局限性,如错误控制问题和多重比较问题。全文150字。
2025-11-16 21:28:57
612
原创 数据分析笔记11:数据容器2
【摘要】本文介绍了Python数据容器元组、字符串和集合的核心特性与操作。元组是不可修改的有序容器,适合存储重要数据;字符串是字符容器,支持索引、切片及常用方法(count/replace/split等);集合具有自动去重特性,适用于数据去重统计。主要内容包括:各类容器的创建方式、查询方法(元组索引、字符串切片)、常用字符串操作(分割、连接、去空格)和集合去重应用场景。最后对比了列表、字典、元组、字符串和集合五大容器的核心差异,为数据存储和处理提供选择依据。
2025-11-16 21:21:43
343
原创 数据分析笔记10:数据容器
本文介绍了Python中常用的数据容器类型及其操作方法。主要内容包括:1. 列表(list):有序可变容器,支持索引、切片和多种操作方法(append/extend/insert/remove等);2. 字典(dict):键值对存储的无序容器,通过键访问值;3. 元组(tuple):有序不可变容器,适合存储固定数据。文章详细讲解了各容器的创建、增删改查操作,以及索引、切片等核心概念,并比较了不同容器的特性差异。最后通过学生信息管理和数据分析实例展示了容器的实际应用。这些数据结构是Python编程的重要基础,
2025-11-16 12:34:50
786
原创 数据分析笔记09:Python条件语循环
本文总结了Python条件语句和循环结构的使用要点。在条件语句部分,重点介绍了if、if-else、elif以及嵌套结构的语法和应用场景,强调缩进对代码层级的关键作用。循环部分详细讲解了while和for循环的执行机制,包括range()函数的三种用法,以及循环控制语句break和continue的区别与适用场景。文章通过实际案例演示了不同语法结构的使用方法,并提供了编程实践中的注意事项,如避免死循环、数据类型转换等。最后对比总结了各种控制结构的语法特点和应用场景,为Python初学者提供了清晰的学习框架。
2025-11-15 19:24:45
769
原创 数据分析笔记08:Python编程基础-数据类型与变量
本文介绍了Python编程基础中的数据类型与变量操作。主要内容包括: 四种基本数据类型:整型(int)、布尔型(bool)、字符串(str)和浮点型(float)及其应用场景; 数据类型转换方法及注意事项; 常用运算符:算术运算、比较运算、逻辑运算和赋值运算; 三种格式化输出方法(%占位符、format()、f-string)及输入操作; Python代码执行顺序和变量赋值规则。文章通过具体示例详细说明了各概念的实际应用,特别强调了类型转换的限制条件和格式化输出的最新推荐方法。
2025-11-15 19:03:19
770
原创 数据分析笔记07:Python编程语言介绍
摘要:Python是一种高效易学的高级编程语言,特别适合数据分析领域。其优势包括简洁语法、丰富库资源(PyPI超53万包)、开源免费和强大数据处理能力。Python广泛应用于数据科学、爬虫、AI及Web开发。学习建议使用Anaconda集成环境(预装数据分析库)和PyCharm社区版(免费)。相比基础Python解释器,Anaconda提供开箱即用的科学计算工具包,显著提升数据分析效率。(149字)
2025-11-15 18:53:29
441
原创 数据分析笔记06:假设检验
本文系统介绍了假设检验的核心概念和应用方法。主要内容包括:假设检验的基本流程与假设建立原则(互斥性、完整性);原假设与备择假设的两种建立思路(验证新假设或质疑现有假设);三种检验类型(上侧、下侧、双侧);两类错误(I型与II型)的定义与控制方法;显著性水平的选取原则;假设检验实施的四个步骤;P值法和临界值法的具体计算与判断规则;并通过咖啡含量检验和高尔夫球驱动距离检验两个案例演示了实务应用。最后总结了概念要点、操作建议,并探讨了假设检验的局限性与实际应用考量。
2025-11-14 14:35:58
911
原创 数据分析笔记05:区间估计
本文介绍了参数估计中的区间估计方法。首先回顾了点估计的定义和三大性质(无偏性、有效性、一致性),并指出点估计的根本问题是无法保证估计值等于真实值。然后详细讲解了区间估计的核心概念,包括边际误差、置信区间和置信水平。针对总体标准差σ已知和未知两种情况,分别给出了基于正态分布和t分布的区间估计公式和计算步骤,并通过Loy百货公司的案例进行说明。文中还比较了不同置信水平对区间宽度的影响,以及t分布的性质和特征。最后总结了两种情况的适用条件和选择标准,并提供了样本大小建议。
2025-11-13 23:28:24
930
原创 数据分析笔记04:抽样方法与抽样分布
本文系统介绍了抽样方法与抽样分布的核心概念。主要内容包括: 总体分类(有限/无限总体)及抽样方法(简单随机、分层、整群、系统抽样) 点估计的原理及统计量与参数的对应关系 抽样分布的特征与数学期望、标准误差的计算方法 中心极限定理的应用及样本大小对分布形态的影响 抽样分布的实际应用案例(EAI公司)和概率计算过程 样本大小与估计精度的关系及点估计的评价标准(无偏性) 重点揭示了样本统计量的分布规律及其与总体参数的关系,为统计推断提供了理论基础。通过实例演示了如何计算抽样概率并评估估计的可靠性。
2025-11-13 18:49:22
695
原创 数据分析笔记03:概率分布理论
本文系统介绍了概率分布理论的核心内容。首先定义随机变量及其分类(离散型和连续型),详细阐述了离散型概率分布的建立方法(古典法、主观法和相对频率法),并给出数学期望、方差和标准差的计算公式。其次,讲解了连续型概率分布的特性,重点分析了均匀分布和正态分布的概率密度函数、特征参数及实际应用。特别强调了标准正态分布的转换方法和概率计算的三大类型,包括查表法和Excel函数使用。最后以电动车电池续航案例展示正态分布的实际应用,通过标准化转换和概率计算解决实际问题。全文逻辑清晰,理论结合实例,为数据分析提供了概率分布基
2025-11-12 16:50:29
1059
原创 数据分析笔记02:数值方法
方法适用场景优劣特点算术平均数对称分布受极值影响大加权平均数不同重要性数据考虑权重分配几何平均数增长率计算消除复利效应中位数偏态分布不受极值影响众数定性分析反映最常见值。
2025-11-12 16:16:54
965
原创 数据分析笔记01:数据分析概述
摘要 数据分析是利用统计方法从大量数据中提取价值的过程,包括描述性、验证性和预测性分析三个方向。通过统计学基础(如总体/样本概念)和数据可视化技术(饼图、条形图等),可分析各类数据(分类型/数量型)。典型应用场景包括:审计抽样节省成本、投资决策(如股票分析)、市场营销(啤酒尿布案例)和产品优化(A/B测试)。企业常用数据分析进行现状描述、原因探查和未来预测。随着数据爆炸式增长,从手机后台收集到用户画像构建,数据分析已成为现代商业决策的核心工具。
2025-11-11 22:40:14
1597
原创 SQL 相关子查询:性能杀手及其优化方法
本文详细分析 SQL 相关子查询为什么会导致性能瓶颈,并提供 JOIN + GROUP BY、窗口函数和 EXISTS 优化的实用解决方案,帮助开发者在生产环境中提升查询效率,避免超时问题。
2025-11-10 23:40:40
986
原创 SQL 子查询:解锁复杂查询的秘密
本文详细解释 SQL 子查询的三种使用位置(WHERE、SELECT、FROM),包括示例代码和最佳实践,帮助初学者和中级开发者提升 SQL 技能,避免常见错误。
2025-11-09 22:54:00
904
原创 别再什么都用 JOIN 了:子查询其实更好用的场景
本文深入探讨 SQL 中子查询(subquery)优于 JOIN 的典型场景,包括存在性检查(NOT EXISTS)、避免 NOT IN 的 NULL 陷阱、以及与聚合值比较等。通过清晰示例和对比,帮助开发者写出更可读、更安全、更易维护的 SQL 代码。
2025-11-08 09:12:24
875
原创 Raycast 新手入门指南:15 分钟彻底取代 Spotlight
Raycast 是一款免费、高效的 macOS 启动器,可完全替代 Spotlight。本文详细介绍了如何在 15 分钟内安装配置 Raycast,启用剪贴板历史、文本片段、窗口管理等核心功能,并推荐实用插件,助你大幅提升 Mac 使用效率。
2025-11-07 21:05:32
2272
原创 macOS 清理-用免费的 Pearcleaner 彻底卸载 Mac 应用(附完整教程)
【摘要】 Mac用户常见误区:直接拖拽删除应用仅能清除60%的文件。本文推荐免费开源工具Pearcleaner,配合Homebrew安装,可彻底卸载应用并清理残留文件。该工具能扫描98%的关联文件(包括缓存、日志等),支持删除前预览,文件先移入废纸篓确保安全。安装仅需终端执行brew install --cask pearcleaner,更新通过brew upgrade pearcleaner一键完成。实测VSCode卸载案例显示,1.4GB残留文件远超应用本体大小。长期使用可有效解决Mac存储不足问题,保
2025-11-07 11:40:36
2563
原创 在 macOS 上使用 Homebrew 安装 MySQL 8.0 完整指南
摘要:本文介绍了在macOS系统上使用Homebrew安装MySQL8.0的完整流程。主要内容包括:安装前的Homebrew准备、执行brew命令自动安装MySQL8.0、启动服务的两种方式、运行安全配置脚本设置密码等安全选项、验证安装以及常用服务管理命令。文章还提供了卸载MySQL的方法,并强调使用Homebrew安装相比手动方式更加简便高效,能自动处理依赖关系和配置。适合需要搭建MySQL开发环境的Mac用户参考。
2025-11-06 19:02:03
566
原创 【LeetCode 177】第 N 高薪水:从 LIMIT 到窗口函数,彻底掌握 SQL 排名问题
【SQL排名问题解决方案对比】本文针对LeetCode177题"第N高薪水",对比分析了三种SQL解决方案。1)LIMIT+OFFSET方法需变量中转,可读性较差;2)推荐使用DENSE_RANK窗口函数,能清晰表达排名意图并自动处理重复值;3)子查询计数方法性能最差。文章特别强调DENSE_RANK()在处理重复值和连续排名上的优势,并指出所有方案都需处理N≤0的边界情况。建议排名类问题优先考虑窗口函数,不仅语义明确,还能保持代码简洁高效。
2025-11-05 16:44:19
882
原创 【LeetCode 176】第二高的薪水:一个被低估的 SQL 优化经典题
本文深入剖析LeetCode176题"第二高的薪水"的SQL解法,指出常见的ORDER BY+LIMIT方案存在性能差(时间复杂度O(nlogn))和NULL处理不当的问题。提出更优解:通过两次MAX函数(时间复杂度O(n)+空间复杂度O(1)),将"排序问题"转化为"过滤问题"——第二高薪水即为所有小于最高薪水的最大值。该方案自动处理NULL情况且天然忽略重复值,通过所有边界测试。强调SQL优化思想:面对"第K大"问题应先考虑
2025-11-05 14:55:13
632
原创 【LeetCode 175】组合两个表:LEFT JOIN 的经典应用场景
LeetCode175题展示了LEFT JOIN的典型应用场景,要求合并Person和Address表并保留所有人信息。关键点在于:1)必须使用LEFT JOIN而非INNER JOIN,才能保留无地址记录的人员;2)LEFT JOIN会保留左表所有行,右表无匹配则填充NULL;3)性能优化建议在Address.personId上建立索引。这道题揭示了JOIN操作的本质区别,特别适用于存在主从关系的表连接场景(如用户与资料)。正确写法应避免WHERE替代ON条件,采用表别名提高可读性。当需求出现"
2025-11-05 11:23:24
620
原创 SQL子查询完全指南:从零掌握嵌套查询的三种用法与最佳实践
SQL子查询是嵌套在其他查询中的SELECT语句,它能将复杂查询分解为多个步骤。本文系统介绍了三种子查询用法:WHERE子句(用于过滤)、SELECT子句(计算列)、FROM子句(派生表)。关键操作符包括IN/NOTIN、EXISTS/NOTEXISTS和比较运算符。文章对比了子查询与JOIN的适用场景,提供决策树帮助选择最佳方案,并给出性能优化建议:使用EXISTS而非NOTIN避免NULL陷阱,为关联字段建立索引,用CTE替代复杂子查询。最后强调存在性检查用EXISTS、与聚合值比较用子查询、多表列查询
2025-11-04 18:55:59
2060
原创 为什么你的 SQL 查询返回零行数据?深入剖析 NOT IN + NULL 陷阱
《SQL查询返回零行的NOTIN+NULL陷阱分析》摘要:当使用NOTIN子查询时,若子查询结果包含NULL值,会导致所有行评估为UNKNOWN而返回零行数据。这种反直觉现象源于SQL的三值逻辑(TRUE/FALSE/UNKNOWN),其中NULL表示"未知",任何与NULL的比较都会产生UNKNOWN。文章提供了三种解决方案:在子查询中过滤NULL值、改用NOTEXISTS(推荐方法)或使用LEFTJOIN。最佳实践建议生产环境优先使用NOTEXISTS,建立适当索引,并通过EXPLA
2025-11-04 17:59:03
1121
原创 VS Code 界面完全解析(新手入门版)
《VSCode界面完全解析(新手入门版)》摘要:本文系统介绍VSCode五大核心组件:左侧活动栏(主导航)、侧边栏(动态内容区)、中央编辑区(代码编辑核心)、底部面板(集成终端等工具)和状态栏(信息仪表板)。通过通俗讲解和图示,帮助新手掌握各组件功能、常用快捷键及自定义布局技巧,包括分屏编辑、禅模式等实用功能。阅读后可快速熟悉VSCode界面布局,提升开发效率。
2025-11-03 22:28:29
1530
原创 5 种 SQL JOIN 类型 5 分钟搞定(附速查表)
SQL JOIN操作是数据库查询的核心技术,本文系统介绍了5种常用JOIN类型及其应用场景。主要内容包括:1) INNER JOIN返回两表匹配数据;2) LEFT JOIN保留左表全部记录;3) RIGHT JOIN保留右表全部记录;4) FULL OUTER JOIN返回两表全部数据;5) CROSS JOIN生成笛卡尔积。文章提供了可视化示例、语法格式和适用场景说明,特别强调INNER JOIN(90%场景)和LEFT JOIN(9%场景)的优先使用原则,并给出避免常见错误的实用建议。通过速查表和决策
2025-11-03 21:42:52
711
原创 我在 Linux 误删了文件——从惨痛教训中学到的经验
摘要:本文分享了在Linux系统中误删文件的惨痛经历与经验教训。文章剖析了Linux命令行删除的危险性,解释了rm -rf命令的运作机制及其破坏力,并提供了6种安全删除实践(如确认目录、使用交互模式、替代工具等)。同时强调了3-2-1备份法则的重要性,介绍了数据恢复的有限手段。作者建议新手使用trash-cli等安全工具,添加确认别名,并指出预防远胜于恢复。这篇实战总结为Linux用户提供了宝贵的数据安全操作指南。
2025-11-02 15:02:14
838
原创 Linux文件查看命令完全指南:cat、less、head、tail、grep使用详解
本文系统介绍Linux系统中五个核心文件查看命令(cat、less、head、tail、grep),通过丰富的实例和真实场景,帮助开发者掌握高效的文件查看技巧,告别低效的文本编辑器,提升命令行操作效率。
2025-11-02 14:09:31
987
原创 Linux文件搜索完全指南:find、locate和通配符使用详解
本文详细介绍了Linux系统中三种主要的文件搜索方法:find命令、locate命令和通配符模式匹配。通过丰富的实例和真实场景,帮助Linux初学者快速掌握文件搜索技巧,提升命令行操作效率。
2025-11-01 22:09:10
768
原创 我开发了一款电影截图拼接神器:Eagle 插件让你的影片收藏更专业
Eagle 用户必装!支持 8 国语言的电影截图拼接插件,提供精准裁切、实时预览、多格式导出功能。让零散的电影截图变成专业的全景拼接图,完全免费开源。
2025-11-01 14:52:06
2560
原创 SQL 自连接详解:当数据表需要与自己对话(组织层级实战)
SQL自连接是一种将表与自身连接的技术,主要用于处理表中行间相互关联的情况,如员工-经理层级关系。本文通过员工管理系统的实例,详细介绍了自连接的概念、应用场景和实现方法。文章解析了如何通过表别名区分同一张表的两个"副本",并演示了四种常见自连接模式:直接下属查询、薪资比较、多层级查询和同事查找。同时指出了使用自连接时常见的错误和性能优化建议,对于深层级结构还介绍了递归CTE作为替代方案。通过可视化图表帮助理解自连接的运作机制,最后提供实战练习巩固学习效果。
2025-10-31 22:02:27
1163
原创 7 个让你看起来像 SQL 新手的 JOIN 错误(以及如何避免)
摘要:本文总结了SQL JOIN查询中7个常见但致命的错误:意外的CROSS JOIN(忘记ON子句)、不使用数据表别名、歧义字段名称、误用INNER JOIN丢失数据、LEFT JOIN后错误过滤、错误的COUNT计数方式以及外键缺少索引。每个错误都通过具体代码示例说明问题,分析后果,并提供专业解决方案。文章还包含JOIN决策流程图和速查表,帮助开发者避免这些让专业人士一眼就能识别出的新手错误,提高查询效率和代码质量。
2025-10-31 21:45:07
658
原创 SQL 查找缺失数据:掌握 LEFT JOIN + WHERE IS NULL 模式(附完整示例)
详解 SQL 中 LEFT JOIN + WHERE IS NULL 查询模式,教你如何查找缺失数据、孤立记录、无订单用户等。包含 5 个生产环境实战案例、3 个常见陷阱解析、完整练习题及答案。适合 MySQL/PostgreSQL/SQLite,代码可直接运行。掌握这个技巧,数据分析和清洗效率提升 10 倍!
2025-10-30 23:17:04
1015
原创 SQL JOIN详解:LEFT JOIN vs INNER JOIN避免数据丢失(附实战案例)
本文系统讲解 SQL 中 INNER JOIN 和 LEFT JOIN 的核心区别和实战应用。通过客户订单数据库案例,详细说明两种 JOIN 类型的语法、原理、使用场景和性能优化技巧。重点分析了初学者最容易犯的错误,包括 WHERE 子句破坏 LEFT JOIN、COUNT 函数误用等问题,并提供完整的决策流程和实战练习。文章包含完整的代码示例、对比表格和性能优化建议,适合 SQL 初学者和数据库开发人员学习参考。
2025-10-30 19:06:18
899
原创 SQL Joins 详解:从零到精通多表查询(附实战案例)
本文系统讲解 SQL JOIN(连接查询)的核心概念和实战应用。通过客户订单数据库案例,详细介绍了 INNER JOIN、LEFT JOIN、RIGHT JOIN、CROSS JOIN 四种连接类型的语法、原理、使用场景和性能优化技巧。文章包含完整的代码示例、常见错误分析和实战练习题,适合 SQL 初学者和数据库开发人员学习参考。
2025-10-29 21:18:42
715
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅