自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 从入门到实操:手把手领略优化数据库查询

例如:某电商订单表数据量 5000 万,执行SELECT * FROM orders WHERE user_id=1001 AND status='已支付' ORDER BY create_time LIMIT 10 需 8 秒。从今天开始,让每一条 SQL 都跑在 "高速公路" 上!如将users表拆分为user_basic(姓名、手机号)和user_extra(地址、简历),减少单表字段数。高选择性字段(如user_id、email)应放在索引前面,低选择性字段(如status、gender)放后面。

2025-05-22 15:06:26 1082

原创 超详细 Navicat 下载安装指引(最新版)

Navicat是一款全球领先的数据库管理工具,支持多种主流数据库如MySQL、Oracle和PostgreSQL,提供直观的可视化操作界面。用户可以根据需求选择不同版本:Navicat Premium适合多数据库连接的企业级应用,Navicat Essentials则专注于单一数据库管理,教育版则提供学生和教师一年免费授权。下载和安装过程简单,用户需访问Navicat官网,选择适合的版本和操作系统进行下载。

2025-05-22 14:24:47 16951

原创 浅析 MECE 原则——滴水不漏的分析逻辑

MECE原则(相互独立,完全穷尽)是一种关键的逻辑拆解方法,广泛应用于数据分析、商业决策和跨部门沟通中。它通过确保分类之间无重叠且无遗漏,帮助解决思路混乱、逻辑漏洞和沟通低效等问题。应用MECE原则的步骤包括明确分析目标、选择拆解维度、检查重叠与遗漏,以及逐层细分直至可落地。常见应用场景包括数据分析与指标拆解、用户分群与精细化运营、商业问题拆解与决策。实际案例展示了如何通过MECE原则拆解用户购买转化率低的原因。注意事项包括避免过度细分、接受“合理穷尽”、结合业务场景调整和动态迭代。MECE原则的终极价值在

2025-05-15 14:31:03 2342

原创 浅析 SQL 脚本:定制化排序与百分比格式化实现

实际开发中,建议结合具体数据库特性(如 MySQL 的FIELD、PostgreSQL 的TO_CHAR)进一步简化代码,同时通过优先级表等设计提升可维护性,让 SQL 代码兼具功能性与优雅性。地市按业务优先级(而非拼音 / 字母)排序(如 "深圳"、"广州"需排在前列):兼顾防错处理(除零保护)、精度控制(固定小数位)、格式转换(数值→字符串):满足汇报 / 报表场景的特定展示顺序(如重点地市前置、汇总数据置顶):将数值转换为业务友好的百分比形式(带单位),直接用于报表展示。

2025-04-24 17:05:43 485

原创 基于Python的Excel多文件数据快速检索方案实战

指定包含 Excel 文件的文件夹路径,并且定义需要读取的列名,这样能过够使 pandas 库读取时更快迅速。通过上述代码,能够高效地从多个 Excel 文件中筛选出符合特定条件的数据,并将结果保存到一个新的文件中。这一方法不仅提升了数据处理的效率,还降低了人工操作的出错的概率。

2025-04-15 09:51:14 926

原创 【A/B测试】深度解析:从理论到实践Python实现详解(含源码)

A/B测试(也称分流测试)在数据分析和产品优化中扮演重要角色。无论是在网站优化、营销活动还是产品改进中,A/B测试都帮助通过数据驱动决策、测试和验证论文提出了实际操作的基本概念,详细讲解了如何实施A/B测试,并通过Python代码示例演示了整个过程。

2025-01-15 11:46:49 1071

原创 【ETL】从理论到实践的数据处理流程及其工具的应用

随着技术的不断演进,实时 ETL、云 ETL 和智能化 ETL 正在成为未来发展的趋势。在大数据时代,随着企业数据量的快速增长,ETL 不仅要满足传统数据仓库的需求,还要应对实时数据流处理和大规模数据集成的挑战。:随着云计算的普及,越来越多的 ETL 任务将迁移到云平台,如 AWS Glue、Google Dataflow 和 Azure Data Factory 提供了灵活的云端 ETL 服务。

2025-01-14 17:21:50 1419

原创 主成分分析【PCA】简介与实战指南(含源码)

PCA(Principal Component Analysis,主成分分析)是一种线性降维技术,它将高维数据投影到一个新的坐标系上,新的坐标系是由数据中方差最大(即信息量最多)的方向构成的。通过这种方式,PCA将高维数据映射到低维空间,保留尽可能多的信息。

2025-01-07 16:37:21 905

原创 【NCRE】全国计算机等级考试三级【数据库技术】—填空题(2)

全国计算机等级考试(National Computer Rank Examination,简称NCRE),是经原国家教育委员会(现教育部)批准,由教育部教育考试院(原教育部考试中心)主办,面向社会,用于考查应试人员计算机应用知识与技能的全国性计算机水平考试体系。NCRE开考之后,受到社会广泛关注和认可,为我国信息化技术人才的培养做出了重要贡献。三级:工程师预备级。三级证书考核面向应用、面向职业的岗位专业技能。报名条件:报名者不受年龄、职业、学历等限制,均可根据自己学习情况和实际能力选考相应的级别和科目。

2024-11-29 17:24:28 1108

原创 【NCRE】全国计算机等级考试三级【数据库技术】—填空题(1)

全国计算机等级考试(National Computer Rank Examination,简称NCRE),是经原国家教育委员会(现教育部)批准,由教育部教育考试院(原教育部考试中心)主办,面向社会,用于考查应试人员计算机应用知识与技能的全国性计算机水平考试体系。NCRE开考之后,受到社会广泛关注和认可,为我国信息化技术人才的培养做出了重要贡献。三级:工程师预备级。三级证书考核面向应用、面向职业的岗位专业技能。报名条件:报名者不受年龄、职业、学历等限制,均可根据自己学习情况和实际能力选考相应的级别和科目。

2024-11-27 10:42:27 2059

原创 探索性数据分析【EDA】:揭开数据的“面纱”(含源码)

探索性数据分析(Exploratory Data Analysis,EDA)是一种用于理解数据的初步分析方法,重点是通过洞察的方式揭示数据的基本特征和潜在模式。EDA不依赖于任何预设模型或假设,而是通过本身数据的分布、趋势和关联性,帮助分析者理解数据的结构。

2024-11-25 15:23:56 1648

原创 通过 Python 【FTP】实现文件上传与下载(含源码)

Python 通过FTP实现文件上传与下载【含代码】。

2024-11-25 11:40:51 2333 1

原创 由浅入深理解【RFM模型】及其应用(含源码)

RFM模型(Recency、Frequency、Monetary)是市场营销和客户关系管理中常用的一种客户分析模型。通过对客户购买行为的深入分析,企业可以更有效地进行客户细分、定制化营销,从而提高客户满意度和企业利润。

2024-11-21 18:03:26 3512

原创 Pycharm 内使用系统默认应用打开文件

背景:在Pycharm内打开文件时候想通过电脑的默认应用打开,而不是通过Pycharm内的界面显示。最终实现使用系统默认应用打开Pycharm中文件。根据下图步骤进行配置。

2024-11-20 15:47:04 626

原创 丧尸电影数据分析:观看评分、评价数与电影受欢迎度的关系(含源码)

近来,丧尸题材的电影一直在全球范围内受到观众的热爱。通过网络电影评分平台,可以挖掘出很多有趣的信息,探讨电影评分、评价数以及影片内容之间的关系。将通过对一组丧尸电影数据的分析,探索分配评分、评价数与评分关系的,以及电影上映年份的影响。

2024-11-19 12:06:34 977

原创 机器学习入门:从数据预处理到模型评估的实战指南

随着人工智能(AI)技术的快速发展,机器学习(ML)作为其核心分支,已经渗透到各个行业和领域。无论是金融、医疗、互联网,还是自动驾驶、智能客服,机器学习的应用都在推动技术变革。那么,作为初学者,如何从零开始学习机器学习,掌握数据预处理、模型选择、评估等基本技能呢?本文将以实际项目为例,带领大家从数据预处理到模型评估,深入了解机器学习的基本流程,帮助你快速掌握这一领域的核心技能。

2024-11-18 16:25:19 713

原创 如何设置Pycharm默认语言为中文/英文

1、打开Pycharm系统设置。2、根据路径:Appearance& Behavior >System Settings > Language and Region 进行操作。3、点击【Apply】之后会弹出弹窗询问是否重启Pycharm以应用设置,根据实际情况选择即可。

2024-11-12 17:53:08 21837 5

原创 聚类算法、分类算法、回归算法常用模型实际应用分享

常用于生物数据分析(例如构建物种的分类树)、市场分析(例如通过树状图了解客户群体的层次结构)等。应用情况:适用于当你知道簇的数量(K)并且数据大致呈现球形簇的情况。常用于市场细分(例如,将客户分成不同的群体以进行定制化营销)、图像压缩(将图像的颜色值分为K个簇)等。常用于图像分类(例如人脸识别)、医疗数据分析(例如疾病预测)等。常用于房地产估价(例如根据房屋特征预测价格)、经济预测(例如预测销售额)等。常用于时间序列预测(例如预测气象数据)、回归分析(例如金融市场预测)等。

2024-07-22 11:44:39 720

原创 Anaconda 新增其他版本Python环境

回车运行,然后就会开始安装相关文件,其中会出现选择是否继续安装库,请根据个人选择进行yes/no,作者这里选择了yes。背景:从Anaconda官网下载下来的Python版本相对教新,需要使用到旧版的Python环境。输入:conda create -n py39 python=3.9 anaconda。本文从已安装好Anaconda的视角出发,首先运行Anaconda Promote。切换回Pycharm中选择新增的解释器,发现已经成功安装好常用的第三方库。安装到最后出现这个界面,既可以关闭该界面。

2024-07-14 00:11:10 479

丧尸电影数据分析数据源

丧尸电影数据分析数据源

2025-01-08

NCRE全国计算机等级考试三级数据库技术(填空题)(1)

全国计算机等级考试(National Computer Rank Examination,简称NCRE),是经原国家教育委员会(现教育部)批准,由教育部教育考试院(原教育部考试中心)主办,面向社会,用于考查应试人员计算机应用知识与技能的全国性计算机水平考试体系。NCRE开考之后,受到社会广泛关注和认可,为我国信息化技术人才的培养做出了重要贡献。 三级:工程师预备级。三级证书考核面向应用、面向职业的岗位专业技能。 报名条件:报名者不受年龄、职业、学历等限制,均可根据自己学习情况和实际能力选考相应的级别和科目。考生可按照省级承办机构公布的流程在网上进行报名。   报名时间:每次考试具体报名时间由各省级承办机构规定,可登录各省级承办机构网站查询。   考试时间:NCRE在全国范围内每年举办两次考试,考试时间一般安排在3月最后一个周六至下周周一、9月倒数第二个周六至下周周一。   考试形式:统一命题,统一考试,考试形式为上机考试。   成绩:NCRE考试实行百分制计分,以等第形式公布成绩。成绩等第分为“优秀”、“良好”、“及格”、“不及格”四等。100-90分为“优秀”,89-80分为

2024-11-22

Kaggle-Pokemon with stats(宠物小精灵数据)

资源来自:https://www.kaggle.com/datasets/abcsds/pokemon

2024-11-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除