自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(278)
  • 资源 (1)
  • 收藏
  • 关注

原创 SQL:实现漏斗、留存、Top-N、去重、行转列/列转行

本文介绍了MySQL 8中用户行为数据分析的常用SQL查询模式。主要包括:1)建立events表及优化索引建议(如(user_id,event_time)组合索引);2)漏斗分析三种实现方式(用户级、按日期分组、会话内);3)留存分析(通过cohort_dt和active_dt计算);4)分组Top-N查询方法;5)数据去重技巧;6)行列转换技术。文章还展示了如何利用EXPLAIN和EXPLAIN ANALYZE进行查询优化分析,为常见的用户行为分析场景提供了实用的SQL解决方案。

2025-11-22 20:04:58 497

原创 从零到精通 Hadoop 的系统学习文档

本文系统介绍了Hadoop生态系统的学习路径与核心技术,包含三个阶段:从伪分布式环境搭建到集群管理与性能优化。重点讲解了HDFS、YARN、MapReduce三大核心组件的工作原理与配置方法,详细说明了Hive数据仓库的使用技巧,包括表类型、分区策略和复杂数据类型操作。最后通过社交平台消息分析的实战案例,展示了从数据清洗到多维统计分析的完整流程,涵盖ETL处理、指标计算和可视化报表生成。文章提供了大量实操命令和配置示例,为大数据开发人员构建了从入门到精通的完整知识体系。

2025-11-22 20:04:33 1241

原创 Tableau 从零到精通:系统教学文档(自学版)

摘要:Tableau是一款以拖拽交互为核心的商业智能工具,提供数据处理、可视化和协作分析的全流程解决方案。其核心组件包括Desktop(可视化制作)、Server/Cloud(协作发布)、Prep(数据清洗)和Mobile(移动查看)。学习路径涵盖从数据连接到发布优化的完整流程,重点掌握基础图表制作、计算分析(行级/LOD/表计算)、交互设计(参数/动作)和性能优化技巧。Tableau支持多种数据源连接方式,提供离散/连续字段处理、标记卡控制等可视化方法,并内置地图、预测等高级分析功能。最佳实践强调合理使用

2025-11-01 21:18:48 1632

原创 从零开始把SQL 窗口函数(Window Functions)学扎实

本文介绍了SQL窗口函数的基本概念和使用方法。窗口函数能在不改变原行数据的情况下,对分组数据进行计算并返回结果。核心语法包括PARTITION BY(分组)、ORDER BY(排序)和窗口帧(计算范围)。文章通过示例演示了5个常见应用场景:组内排名(ROW_NUMBER/RANK)、累计求和、滚动平均值、前后行比较(LAG/LEAD)以及组内占比计算。还详细解释了窗口帧的不同配置方式,如累计值、N期滚动等,并总结了常用窗口函数模板,帮助新手快速掌握这一实用技术。

2025-11-01 21:18:31 397

原创 【数分实战】基于100万淘宝电商用户的1亿条行为数据分析

本文介绍了淘宝用户购物行为数据分析的全流程。首先对数据集进行说明,包括用户ID、商品ID、行为类型等字段。然后详细讲解Kettle工具的安装配置过程,包括JDK安装、MySQL驱动配置等。接着进行数据库准备和数据预处理,包括数据清洗、去重、异常值处理等。通过SQL分析获客情况、用户留存率、时间序列行为模式、用户转化路径等核心指标。最后构建RFM用户分层模型,分析商品热度和转化率,为电商运营提供数据支持。整个分析过程包含建表、数据清洗、多维分析和可视化展示等多个环节。

2025-10-11 23:10:33 317

原创 Pandas数据清洗技巧大全

本文介绍了使用Pandas进行数据清洗的完整流程,主要包括:1)缺失值处理(检测、删除和填充);2)重复数据处理(检查与删除);3)数据类型转换(日期、类别等);4)字符串清洗(大小写转换、正则处理);5)异常值检测(Z-score和IQR方法);6)数据标准化(归一化与Z-score);7)数据分箱(等宽与等频分箱);8)数据合并(concat和merge)与透视表;9)应用函数转换;10)清洗后数据保存(CSV/Excel)。文章提供了完整的代码示例,涵盖数据清洗的主要技术要点。

2025-10-08 17:23:16 466

原创 深度学习算法

神经网络是一种模拟人脑神经元结构的计算模型,由输入层、隐藏层和输出层组成,通过权重连接和激活函数实现复杂映射。其核心组件包括人工神经元、卷积层、池化层等,常见架构有全连接网络、CNN、RNN、LSTM等。训练过程采用反向传播算法,通过梯度下降优化参数。CNN擅长图像处理,RNN/LSTM适合序列数据,GAN则用于生成逼真数据。神经网络广泛应用于图像识别、自然语言处理等领域,是现代深度学习的基础。

2025-10-06 15:24:10 353

原创 机器学习算法以及code实现

本文系统介绍了机器学习中监督学习(线性回归、岭回归、Lasso回归、随机森林回归、XGBoost等回归算法,逻辑回归、SVM、决策树、随机森林等分类算法)和无监督学习(K-Means、DBSCAN聚类算法,PCA降维算法)的核心概念、原理及应用场景。详细阐述了数据预处理(归一化、标准化、特征编码)、模型评估指标(分类任务中的精确率、召回率、F1-score,回归任务中的MSE、RMSE、MAE,聚类任务中的轮廓系数、ARI等)以及交叉验证等关键技术。通过Python代码示例展示了各算法的完整实现流程,包括数

2025-09-30 16:43:38 690

原创 数据分析-Excel-常用函数

本文总结了Excel常用函数功能及语法: 查找函数:VLOOKUP(按行查找)、HLOOKUP(按列查找)、MATCH(返回位置)、INDEX(返回指定位置值) 统计计算:SUBTOTAL(多方式汇总)、STDEV(标准差)、SUMIF(条件求和) 逻辑与文本:IF/AND/OR/NOT(条件判断)、LEFT/RIGHT/MID/FIND(文本处理) 动态引用:OFFSET(偏移引用)、INDIRECT(文本转引用) 日期函数:NOW/TODAY/WEEKDAY(日期时间处理) 各函数均包含核心参数说明,如

2025-09-28 08:28:29 1132

原创 从0到1学习Vue框架Day06

本文档包含Vue.js相关技术的多个主题,主要内容包括: 虚拟DOM与diff算法:讲解v-for指令中key属性的重要性,分析使用index作为key可能导致的问题。 列表处理:介绍列表过滤(使用watch和计算属性实现)和列表排序(三种排序方式)的实现方法。 表单数据收集:展示如何收集各类表单元素的数据,包括文本框、单选框、复选框、下拉框等。 过滤器:演示全局和局部过滤器的定义与使用,包括链式调用。 指令系统:讲解v-text、v-html、v-cloak、v-pre等内置指令,以及自定义指令的实现方式

2025-09-24 11:07:28 306

原创 从0到1学习Vue框架Day05

本文展示了Vue.js中数据监视、样式绑定和条件渲染的实现方法。主要包括:1)使用watch实现深度监视和多级属性监控;2)computed和watch在比较大小功能中的不同实现;3)class绑定的三种形式(字符串、数组和对象);4)style绑定的动态写法;5)条件渲染指令v-if、v-else和v-show的选择使用;6)列表渲染的v-for指令及其在数组、对象和字符串上的应用。这些示例演示了Vue.js的核心数据处理和DOM操作功能。

2025-09-24 10:55:28 326

原创 从0到1学习Vue框架Day04

本文摘要: Vue框架源码解析显示data可以是对象或函数,通过代理机制实现数据访问。事件绑定使用v-on指令,回调函数在methods中定义,支持修饰符(.stop/.prevent等)和按键处理。计算属性(computed)通过getter/setter复用逻辑并缓存结果,提高效率。监听属性(watch)可监测数据变化,执行自定义逻辑。methods中的this指向Vue实例,箭头函数需注意作用域问题。Vue提供_data(内部)和$data(外部)两种数据访问方式,通过代理实现响应式更新。

2025-09-24 10:41:22 369

原创 从0到1学习Vue框架Day03

摘要:本文介绍了Vue实例(VM)的属性访问规则,重点分析了以$和_开头的属性区别。通过示例展示了Object.defineProperty()方法实现数据代理的机制,包括getter/setter配置项的使用。同时说明了Vue框架对属性命名的限制要求(避免使用$和_开头),并演示了数据代理在Vue中的实现原理。文中包含多个HTML代码示例,展示了Vue的基本用法和数据绑定的实现过程。

2025-09-09 21:49:24 266

原创 从0到1学习Vue框架Day02

本文介绍了Vue.js的模板语法和MVVM分层思想,主要包括:1) 插值语法{{}}的使用规则,支持data变量、常量和合法JS表达式;2) 指令语法v-的特性,包括v-once、v-if等指令的用法;3) v-bind指令实现属性动态绑定及其简写方式;4) v-model双向数据绑定的特点及与v-bind的区别;5) MVVM分层思想中Model、View和ViewModel的作用。Vue基本遵循MVVM模式,通过ViewModel实现了数据和视图的分离与自动同步。

2025-09-08 20:06:11 255

原创 从0到1学习Vue框架Day01

本文介绍了Vue.js的基本使用方法和核心概念:1)通过new Vue()创建实例时需传入options配置对象;2)template配置项定义模板语句,必须包含单个根节点,支持插值语法{{}}调用data数据;3)Vue实例通过$mount()或el选项与DOM容器绑定,遵循"一夫一妻制"原则,即一个实例只能绑定一个容器,反之亦然;4)data选项为模板提供数据支持,支持对象和嵌套数据结构。这些内容涵盖了Vue实例创建、模板语法、数据绑定等基础知识点。

2025-09-07 22:13:39 486

原创 SpringMVC一镜到底

SpringMVC摘要(150字) SpringMVC是基于Spring的Web开发模块,核心是DispatcherServlet,负责接收请求并转发至@Controller注解的控制器对象。处理流程:用户请求→DispatcherServlet→处理器映射器→控制器方法→返回ModelAndView→视图解析器渲染。支持注解开发,参数自动绑定(如HttpServletRequest、ModelAndView),并解决乱码(通过CharacterEncodingFilter)。拦截器(实现HandlerIn

2025-07-20 23:19:05 672

原创 Spring

Spring框架核心概念与特性摘要 Spring是一个轻量级企业级开发框架,通过IOC(控制反转)和AOP(面向切面编程)实现解耦。IOC由容器管理对象创建及依赖关系,技术实现为DI(依赖注入);AOP基于动态代理(JDK/CGLib)实现非业务功能(如日志、事务)的统一管理。Spring整合MyBatis时,通过IOC创建SqlSessionFactory等核心对象。事务管理提供统一模型,支持声明式事务(@Transactional注解)和编程式事务。Web项目中通过ContextLoaderListen

2025-07-20 21:56:37 1024

原创 MyBatis从浅入深

MyBatis框架技术总结 MyBatis是一个基于Java的持久层框架,它简化了数据库操作,增强了JDBC功能。核心特点包括: 三层架构设计:界面层、业务逻辑层和数据访问层,分别对应Controller、Service和DAO包 SQL映射:将数据库行数据映射为Java对象 动态SQL:支持条件查询、循环等复杂操作 结果映射:通过resultType和resultMap灵活处理查询结果 简化开发:自动处理Connection、Statement等资源管理 主要优势: 与JDBC相比代码量减少50%以上 支

2025-07-20 21:15:30 755

原创 Maven 一篇搞懂

Maven核心概念与实践指南 Maven是一个项目管理工具,主要解决传统开发中的JAR依赖管理问题。它能自动下载依赖、管理版本、处理依赖传递关系,并提供编译、测试、打包、部署等全生命周期管理。 核心特性包括: 标准化目录结构 POM项目对象模型(pom.xml) 坐标体系(groupId/artifactId/version) 本地仓库与远程仓库机制 构建生命周期(clean/compile/test/package/install/deploy) 安装配置要点: 下载解压后配置M2_HOME环境变量 修改

2025-07-20 20:27:07 1111

原创 动态代理的基本原理

摘要:代理模式是一种设计模式,分为静态代理和动态代理。静态代理需要手动创建代理类,适用于目标类较少的情况,但类数量增多时维护成本高。动态代理通过反射机制动态生成代理对象,无需手动编写代理类,能灵活增强功能且减少代码量。JDK动态代理要求目标类实现接口,而CGLib通过继承方式实现代理。代理模式常用于功能增强和访问控制,如代购、短信服务等场景,既能保护目标对象,又能扩展功能。(149字)

2025-07-20 20:15:26 488

原创 seaborn入门

摘要:本文介绍了Seaborn数据可视化库的使用方法,重点讲解了三类图形绘制技巧:单变量图形(如直方图)、双变量图形(如散点图、二维直方图)和类别图(如箱线图、小提琴图)。通过具体代码示例,展示了如何利用distplot()、jointplot()、pairplot()等函数进行数据可视化分析。文章特别强调了Seaborn相比matplotlib的优势,包括更简洁的API和更美观的默认样式,适合快速创建专业级统计图表。

2025-07-20 17:23:55 249

原创 Pandas 一篇文章搞懂

Pandas是一个强大的Python数据分析库,提供高效的数据结构和数据处理功能。其主要数据结构包括Series(一维)、DataFrame(二维)和MultiIndex(三维)。Pandas支持便捷的文件读写(CSV、HDF5、JSON等)、数据清洗(缺失值处理)、数据转换(离散化、One-Hot编码)、数据合并(concat、merge)以及统计分析(交叉表、透视表、分组聚合)。通过内置的Matplotlib和NumPy集成,Pandas还能实现数据可视化。其核心优势在于增强数据可读性、便携的数据处理能

2025-07-20 17:04:49 589

原创 Numpy入门实践

NumPy是Python中强大的科学计算库,主要用于高效处理多维数组数据。其核心ndarray对象支持并行运算,能显著提升计算效率。NumPy提供丰富的数组操作功能,包括创建各种数组(全1/0数组、等差/等比数列、正态分布数组)、形状修改(reshape/resize/转置)、类型转换和逻辑运算。特别支持广播机制,使不同形状数组能进行数学运算。此外,NumPy还包含矩阵运算API(matmul/dot)和统计函数(min/max/mean等),适合数值计算和数据分析任务。相比原生Python列表,NumPy

2025-07-20 16:28:22 254

原创 Matplotlib快速入门

Matplotlib是Python中用于2D/3D数据可视化的强大库。文章介绍了Matplotlib的基本使用流程:1)创建画布(set size/dpi);2)绘制图像(plot函数);3)显示图像(show)。详细讲解了如何添加坐标轴刻度、网格线、标题标签等元素,解决中文乱码问题,以及绘制多条曲线并添加图例。还展示了如何在多个坐标系中绘制不同图表,包括使用numpy生成sin函数曲线。关键点包括:保存图像需在show之前,多图表可通过subplots实现,设置字体防止中文乱码。这些功能使Matplotl

2025-06-18 23:27:17 346

原创 Python从入门到精通

定义变量的语法: a = 10 a = b = c = 20注释: # ''' '''python在第一行可以指定文件的编码格式:#coding:gbk数据类型:int, float, bool, str输出系统的关键字 import keyword print(keyword.kwlist)查询对象所存储的内存地址:id(obj)查询对象的数据类型:type(obj)将其他数据类型转为字符串:str(obj)将其他

2025-06-18 23:05:12 801

原创 Linux服务器入门教程

如果文件的开始是.说明当前文件是一个隐藏文件。其他用户的家目录在/home/用户名为家目录。$PATH Linux的环境变量。Linux的命令与参数用空格隔开。..指向当前目录的上级目录。整个Linux的文件跟目录。如果是字母或者缩写一般加-每个用户的家目录是不同的。如果是单词,一般加--/home:存放所有用户文件的根目录。/usr:本次系统管理员软件安装目录。/etc:存放系统管理和配置文件。/opt:额外安装的可选应用程序。/bin:存放常用命令。/root:超级用户。

2025-06-15 22:57:58 434

原创 JSP全流程

本文介绍了JSP(JavaServer Pages)技术的关键内容。主要包括:1)JSP规范定义了JSP文件的开发流程和运行机制,解决了响应对象处理大数据量的局限性;2)详细说明了JSP内置对象(request、session、application)的作用和使用方法;3)阐述了Servlet与JSP的分工协作关系;4)解析了JSP文件的运行原理,即如何被编译和执行;5)重点讲解了EL表达式的语法、作用域对象的使用、简化版特性及其运算功能。全文系统性地介绍了JSP技术的核心概念和应用场景,为Java Web

2025-06-15 15:33:14 784

原创 Servlet完整笔记

本文摘要:Servlet是JavaEE规范中用于开发动态Web资源的组件。Servlet规范规定了动态资源文件的开发步骤、调用规则和管理规则。开发Servlet需要继承HttpServlet并重写doGet/doPost方法,同时在web.xml中注册。Servlet生命周期由Tomcat管理,可通过HttpServletRequest和HttpServletResponse处理请求和响应。数据共享可通过ServletContext、Cookie、HttpSession等实现。监听器接口用于监控作用域对象变

2025-06-15 13:44:38 908

原创 jQuery和Ajax从浅到深-03

本文简要介绍了jQuery的基本概念和使用方法。主要内容包括:jQuery的初始化和DOM加载事件、DOM对象与jQuery对象的相互转换、常用选择器和过滤器的使用、核心函数(val、text、attr等)的操作、事件绑定方式、each遍历方法以及Ajax请求的实现(包括$.ajax、$.get、$.post)。文章还对比了全局刷新和局部刷新,解释了XMLHttpRequest对象在Ajax中的作用和状态变化,并介绍了JSON数据格式的优势及其处理方法。通过jQuery可以简化JavaScript编程,提高

2025-06-13 17:41:33 941

原创 前段三剑客之JavaScript-02

JavaScript基础语法与核心概念概述:JavaScript由语法、DOM和BOM组成,提供alert()、console.log()等输入输出方式。变量声明用var,数据类型通过typeof检测(返回undefined、string等类型)。全局/局部变量需注意var的使用。数据类型转换包括toString()、parseInt()等方法。函数定义灵活,无需指定返回值类型。面向对象通过构造函数和prototype实现。数组创建方式包括new Array()和[]。DOM操作涵盖元素创建、增删改查等。正

2025-06-06 17:07:42 797

原创 HTML-CSS-看这篇就够了-01

本文摘要: 本文系统梳理了HTML和CSS核心知识点,主要包括:HTML基础标签(文本、图片、表格、表单等结构化元素)、CSS样式控制(选择器、文本/背景样式、盒子模型)、页面布局技术(浮动、定位)以及元素显示控制(隐藏、对齐方式)。重点讲解了盒子模型的组成、浮动定位原理、清除浮动方法,并提供了CSS属性书写顺序建议。内容涵盖网页开发的基础标签使用到进阶布局技巧,适合作为前端开发的速查参考。

2025-06-06 00:03:48 235

原创 继MySQL之后的技术-JDBC-从浅到深-02

JDBC技术全解析:从基础到高级应用 摘要:本文系统介绍了Java数据库连接(JDBC)技术的核心内容。首先阐述了JDBC统一接口的优势和编程六步骤,包括驱动注册、连接获取等基本操作流程。重点分析了SQL注入问题及PreparedStatement的解决方案,通过预编译机制提高安全性和效率。详细讲解了事务管理、批处理优化、数据库连接池原理及应用,对比了C3P0、Druid等常见连接池特点。最后介绍了Apache-DBUtils工具类简化JDBC开发,以及通过BasicDAO实现通用数据访问层的最佳实践。全文

2025-06-05 15:39:30 930

原创 MySQL数据库从0到1

SQL语句的分类:DQL:查询语句,凡是select语句都是DQL。DML:insert,delete,updata,对表当中的数据进行增删改查。DDL:create,drp,alter,对表结构的增删改。对sql脚本的理解:以sql结尾的文件,被称为sql脚本。直接使用source命令可以执行sql脚本。

2025-06-02 11:10:26 1092

原创 计算机考研复试08

【代码】计算机考研复试08。

2025-04-05 10:54:49 179

原创 计算机考研复试上机07

考研复试

2025-02-22 21:05:02 933

原创 计算机考研复试上机06

计算机考研复试上机06

2025-02-22 10:55:16 945

原创 计算机考研复试上机05

计算机考研复试上机05

2025-02-13 22:07:48 877

原创 计算机考研复试上机04

计算机考研复试上机04

2025-02-11 16:46:50 463

原创 计算机考研复试上机03

计算机考研复试上机03

2025-02-11 13:05:25 1025

原创 计算机考研复试上机02

题目描述:对输入的 n 个数进行排序并输出。输入:输入的第一行包括一个整数 n(1 <= n <= 100)。接下来的一行包括 n 个整数。

2025-02-07 20:29:44 1236

java开发工具,jdk1.8

java初学者必备

2022-03-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除