- 博客(15)
- 收藏
- 关注
原创 重磅升级V2.0我写了个 Git 提交助手:文件再多也能像“点菜”一样选着提交
本文介绍了Git批量提交脚本的优化改进方案。针对原脚本存在的安全性、健壮性、功能性和用户体验等方面的问题,提出了多项具体修改建议,并进行修改完善。
2025-12-21 22:10:04
1240
原创 数据清洗及特征处理----动手学数据分析:实战系列(第四天)
本文摘要: 本文系统介绍了数据分析中的数据清洗流程,重点讲解了缺失值、重复值和特征处理的方法。首先通过df.info()和isnull().sum()观察缺失值分布,详细对比了np.nan、None和isnull()的适用场景。随后演示了dropna()删除缺失行、fillna()填充缺失值等操作。在重复值处理部分,讲解了duplicated()检测和drop_duplicates()删除重复数据的方法。最后针对特征处理,介绍了年龄分箱、文本编码等技巧
2025-12-20 21:25:32
920
原创 我写了个 Git 提交助手:文件再多也能像“点菜”一样选着提交
Git交互式分批提交助手 本开源PowerShell脚本旨在解决Git多文件提交的常见痛点,提供安全可控的交互式提交流程。主要功能包括: 自动检测Git仓库状态和分支信息 交互式选择待提交文件 敏感文件检测和大文件提醒 分批提交与推送前二次确认 主分支保护机制 使用说明: 需在Git仓库目录下运行 支持自由修改和分发 保留原作者信息 注意:新建项目文件夹需手动提交
2025-12-19 15:23:53
892
原创 动手学数据分析:实战系列(第三天)
sort_index是按标签(行或列名)排序,适合整理表头顺序。是按数据内容排序,适合分析和查找极值、排名等。支持多列排序,优先级从左到右。axis=1控制是对行还是对列排序(0为行,1为列)。ascending控制升序还是降序。实际应用时,按内容排序更常用于数据分析,按索引排序更常用于数据展示和整理。
2025-12-18 18:52:40
670
原创 动手学数据分析:实战系列(第二天)
本文介绍了pandas数据分析的基础操作,重点讲解了DataFrame和Series两种核心数据结构的使用方法。主要内容包括:1) 通过字典创建Series和DataFrame的示例;2) 加载csv文件并查看列名;3) 两种访问列数据的方法比较(字典访问法和属性访问法);4) 数据筛选逻辑,包括布尔条件筛选、多条件组合、索引重置等操作;5) loc和iloc两种数据选取方式的区别与应用场景。文章通过具体代码示例帮助读者掌握pandas数据分析的基础技能。
2025-12-18 09:27:54
1086
原创 Python 词云图入门:从特朗普推文数据到可视化词云
本文以 Kaggle 上的特朗普推文数据为例,带你用 Python 从零生成一张可复现的词云图。我们先用 Pandas 读取 CSV,并通过缺失值检查确认核心分析列为 `text`;随后将所有推文合并为长文本,结合 `wordcloud.STOPWORDS` 与自定义停用词表,过滤链接碎片与高频噪声词,提升词云信息密度。接着导入头像轮廓图片作为 mask 掩码,配合红蓝渐变色映射生成具有主题风格的词云可视化,并用 Matplotlib 完成展示。最后进一步提取词频并输出 Top20 高频词并展示。
2025-12-17 08:02:51
901
原创 动手学数据分析:实战系列(第一天)
动手学数据分析摘要 课程概述 本课程通过泰坦尼克号数据集实战数据分析全流程,涵盖数据加载、初步观察和保存等基础操作,帮助学习者掌握Python数据分析工具。
2025-12-16 19:35:09
1255
原创 操作系统期末复习:最全银行家算法例题解析,一次搞懂死锁避免
简单来说,它是操作系统在分配资源前的一种**“预判”机制**。核心思想:当一个进程向系统申请资源时,操作系统不会马上给它,而是先进行一次**“模拟分配”**(试探),然后计算一下:“如果我把这笔资源借给你,剩下的资源还能不能让所有人都顺利完工?批准请求,真的分配资源。拒绝或推迟请求,让进程等待。
2025-11-29 16:36:49
924
原创 操作系统调度算法最强总结!10 分钟彻底搞懂 FCFS / SJF / SRTF / RR / HRRN(附甘特图)
本文系统梳理了操作系统中常见的七类调度算法,包括 FCFS、SJF、SRTF、优先级调度、HRRN 以及时间片轮转 RR 等。文章在教材原理的基础上,结合实际例题、甘特图与计算表格,对每种算法的调度逻辑、适用场景、优缺点及常见易错点进行了说明。同时补充了新手易混淆的概念,如 SJF 与 SRTF 的区别、RR 中队尾/队首规则、HRRN 的响应比计算等。内容结构清晰,适合期末复习、考研准备及入门操作系统的同学快速掌握核心知识点。
2025-11-28 17:13:31
1095
原创 【保姆级教程】Windows 10/11 安装 Docker Desktop:自定义安装路径 + WSL2 环境配置 + 常用术语中英对照
Docker Desktop 默认安装在 C 盘,且随着镜像和容器的增加,会占用大量系统盘空间。WSL2 更新卡在 0% 的问题。强制修改 Docker 安装路径(默认安装包没有路径选择界面)。PowerShell 命令行安装时的报错解决。界面英文术语对照。Docker Desktop 的官方安装包双击运行是无法选择安装路径的,它会默认装到 C 盘。我们需要使用 PowerShell 命令行来进行安装。
2025-11-24 10:25:22
1551
原创 使用 Shell 脚本优雅管理 Hadoop:支持伪分布式与完全分布式的多环境切换 + 专业级状态检查
本文提供的 hadoop-manage.sh 终极增强版脚本,旨在解决多环境并存下的管理混乱问题。脚本通过自动注入对应的 Hadoop 环境变量,实现伪分布式与完全分布式的无干扰切换,并统一支持 start、stop、jps、status 等常用操作。用户无需修改 /etc/profile,也无需记忆多个脚本路径,一个命令即可完成任意版本的 Hadoop 启动、停止和状态检查。脚本结构清晰、彩色输出友好,易于扩展,可适配 Spark、HBase、ZooKeeper 等更多组件。
2025-11-16 15:45:55
1008
4
原创 Maven 从入门到精通:全流程实战与原理详解
本文系统讲解了 Maven 的基础概念与实战应用,从安装配置、目录结构、仓库管理,到依赖传递、生命周期、插件使用,全方位解析 Maven 在项目构建与管理中的核心机制。通过图表、命令与实例,帮助读者快速掌握 Maven 的工作原理与常用命令,理解“约定优于配置”的设计思想,熟悉从命令行到 IDEA 的项目构建流程。阅读本文后,读者可独立完成 Java/Web 工程的创建、打包与部署,实现高效、标准化的项目管理。
2025-11-10 22:32:27
1466
原创 MySQL从基础到入门 黑马程序员1-27节
本文是MySQL数据库基础篇的学习笔记,主要总结了SQL通用语法及四大分类(DDL、DML、DQL、DCL)的核心操作,内容源自黑马程序员B站教程。笔记通过具体代码示例展示了各类SQL操作,如建表、字段修改、数据插入等,并标注了常见注意事项(如UTF8字符集选择)。内容结构清晰,可作为MySQL基础操作的速查参考。
2025-11-07 16:51:40
1294
原创 MongoDB数据库将.csv格式数据通过命令终端、图形界面、Pycharm导入MongoDB数据库
本文系统介绍了三种将 Excel 或 CSV 文件导入 MongoDB 数据库 的方法:命令终端导入、PyCharm 脚本导入以及图形界面工具导入
2025-11-06 02:15:04
987
原创 从误删到完美修复:MySQL sys 数据库恢复全过程(附详细命令)
本文详细记录了一次 MySQL 8.0.37 中误删 sys 系统数据库后的完整修复过程。从问题排查、datadir 定位、初始化数据目录,到 root 密码重置与 sys 库自动重建,涵盖常见错误解决思路与安全注意事项。适合数据库初学者与开发者收藏。
2025-11-02 23:56:08
775
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅