自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

coffeetogether的博客

数据分析师的成长历程

  • 博客(75)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据分析师的转型之路—本人真实经历

本篇文章讲的内容主要针对想转行或了解数据分析的大学生或研究生们

2024-01-06 19:49:57 1172

原创 SQL 使用CASE WHEN实现RFM参数—F(Frequency)

博主目前从事的是BA数据分析师、在实际工作中需要问其他部门的同事提供SQL需求,在最近的工作中大量用到SQL搭建RFM模型的案例,其中分别涉及到参数R,F和M的参数实现。因此,以我实际工作遇到的问题进行总结。

2022-05-05 14:05:02 1079 1

原创 SQL 使用ADD_MONTHS或ADDDATE实现RFM参数—R(Recency)

博主目前从事的是BA数据分析师、在实际工作中需要问其他部门的同事提供SQL需求,在最近的工作中大量用到SQL搭建RFM模型的案例,其中分别涉及到参数R,F和M的参数实现。因此,以我实际工作遇到的问题进行总结。

2022-05-04 19:45:32 2442

原创 SQL使用case when进行等级分组

目前博主从事一份电商方向的BA数据分析师的工作。目前的工作内容主要是指标的理解和使用SQL或视ETL实现指标需求。博主最近在实际工作中遇到了一个问题,就是不同人分等级的问题。下面直接通过实例进行解释,给问题进行思路和方法上的分析。

2022-04-23 23:02:52 5062 2

原创 SQL规范一《SQL 语法顺序与编码规范 》

博主目前从事的是BA数据分析师、在实际工作中需要问其他部门的同事提供SQL需求,在此过程中,SQL代码的规范与否是非常重要的,规范的代码有助于成员间交流,保证一致性、统一性。因此,以我实际工作遇到的问题进行总结。

2022-04-06 13:43:35 1210

原创 SQL文件更改默认打开方式

介绍怎样设置SQL文件默认的打开方式。无需每次点击开发方式进行选择。

2022-03-25 10:49:57 1657

原创 SQL中UNION ALL与WITH ROLLUP的作用与区别

工作中经常使用UNION ALL和ROLL UP对数据进行表格合并和分组汇总。下面直接通过实例进行解释,防止大家进入误区。

2022-03-24 22:16:35 719

原创 SQL内连接、左连接、右连接的区别

SQL内、左、右连接之间的区别。通过实例对比,防止单纯的理解上存在的误区。

2022-03-22 17:16:58 11564 3

原创 Excel函数大全六《文本处理函数》

文本处理函数1、连接函数(concatenate函数)2、len、lenb函数3、Exact函数4、upper、lower函数5、proper函数6、left、right、mid函数7、find、search函数8、replace函数9、subtitute函数1、求和与统计函数2、数字处理函数3、日期与时间函数4、查找与引用函数5、逻辑与信息函数6、文本处理函数1、连接函数(concatenate函数)案例:将车型与类型进行拼接案例2:判定是否录取总结:concatenate函数参

2021-11-12 16:50:29 1384

原创 Excel函数大全五《逻辑与信息函数》

逻辑与信息函数1、and,or,not函数2、if函数3、is类函数(istext,isnumber,isnontext函数)4、iferror函数1、求和与统计函数2、数字处理函数3、日期与时间函数4、查找与引用函数5、逻辑与信息函数6、文本处理函数1、and,or,not函数案例:判断学生成绩是否优秀案例2:not函数的使用注:and函数:所有条件成立成立返回True,否则返回Falseor函数:所有条件只要成立一个,返回,True。否则返回False。and和or函

2021-11-12 15:30:24 751

原创 Excel函数大全四《查找与引用函数》

1、Choose函数案例1:求月份对应的季度案例2:对销售业绩进行评定。注:Choose函数参数1:索引值;参数2:索引值=1返回的值;参数3:索引值=2返回的值… …2、查找函数(vlookup、hlookup函数)案例1:求不同销售额对应的提成率总结:vlookup函数用于纵向查找vlookup函数参数1:要查找的对象;参数2:查找表格;参数3:查找结果所在列的索引值;参数4:查找类型(精确查找/模糊查找)hlookup函数用于横向查找hlookup函数参数1:要查找的对象;

2021-11-11 21:00:07 5416 1

原创 Excel函数大全三《日期与时间函数》

日期与时间函数一、提取日期(year,month,day,hour,minute,second函数)二、组合日期函数(Date函数,Time函数)三、查看星期(weekday,weeknum函数)四、查看工作日(networkdays,workday函数)五、n月后的日期(eomonth,edate函数)六、时间间隔(Datedif函数)1、求和与统计函数2、数字处理函数3、日期与时间函数4、查找与引用函数5、逻辑与信息函数6、文本处理函数本文介绍数字处理函数部分。一、提取日期(year,m

2021-11-11 18:52:31 3544 1

原创 Excel函数大全二《数字处理函数》

数字处理函数1、四舍五入(round函数)2、向下/上舍入(roundup,rounddown函数)3、取整函数、截断函数(Int,Trunc函数)4、随机函数(rand,randbetween函数)5、取余函数(mod函数)6、取商函数(QUOTIENT函数)1、求和与统计函数2、数字处理函数3、日期与时间函数4、查找与引用函数5、逻辑与信息函数6、文本处理函数本文介绍数字处理函数部分。1、四舍五入(round函数)案例1:四舍五入到小数点后两位总结:round函数参数1:要四舍五

2021-11-11 16:30:44 1063

原创 Excel函数大全一《求和与统计函数》

前言:Excel中函数的使用比较广泛,运用函数处理少量数据时非常方便。将Excel中函数进行一下分类,对不同类别中的函数进行详细的介绍。1、求和与统计函数2、数字处理函数3、日期与时间函数4、查找与引用函数5、逻辑与信息函数6、文本处理函数一、求和与统计函数1、求和函数(sum)案例1:求各品牌分别在每月和每个季度的销量合计案例2:求2018-01-01到2018-01-06每天的累计销售额注:sum函数中参数1:求和的第一个数;参数2:求和的第二个数;以此类推… …2、条件

2021-11-11 15:20:08 3536

原创 Excel数据透视表经典教程十三《打印数据透视表/图》

前言:1、打印数据透视表2、分项、分页打印3、重复打印行标签4、打印数据透视图一、打印数据透视表注:打印标题,需要重新选择打印区域。2、分项、分页打印案例:将不同的品牌字段打印在不同页里(即分项打印)。在汇总下面每一项都添加分页符,实现分项、分页打印。打印预览如下:将不同年份的数据打印在不同页中点击显示报表筛选页3、重复打印行标签操作结果如下:四、打印数据透视图选中数据透视图,点击打印预览预览结果:...

2021-11-10 17:31:08 761

原创 Excel数据透视表经典教程十二《数据透视图》

前言:1、创建数据透视图2、设置透视图3、筛选图表数据项4、格式图表5、图表模板一、创建数据透视图数据透视图与普通图表的创建基本一样,只是数据透视图的创建是基于数据透视表的。创建数据透视图的方式有两种1.1、直接基于数据源创建数据透视图1.2 通过数据透视表创建数据透视图...

2021-11-09 21:29:17 22047 1

原创 Excel数据透视表经典教程十一《数据透视分析》

前言:数据透视分析部分,主要包括1、排序2、筛选3、切片器4、清除已删标题项5、突出显示特定值6、数据条7、色阶8、图标集9、编辑条件格式一、排序1.1 通过数据选项卡同样能对数值字段进行排序。1.2 自定义排序编辑自定义序列按照自定义序列排序二、筛选透视表对字段中值进行筛选2.1 对地区值进行筛选eg:筛选出不同地区收入汇总大于8000的项。筛选结果如下:2.2 对品牌进行筛选对品牌筛选后结果2.3 报表筛选对字段进行筛选例:只筛选出地

2021-11-03 19:29:05 2645

原创 Excel数据透视表经典教程十《值的汇总及显示方式》

前言:本文介绍值得汇总以及显示方式,大致内容如下:1、值多汇总方式2、值百分比显示3、多字段百分比显示4、父级百分比显示5、差异显示6、累计值7、升、降序显示一、值多汇总方式将数据字段拖进数值中,默认会将字段进行总计求和的操作。可以通过设置不同的汇总方式查看不同的计算方式。1.1、设置值字段创建不同品牌收入总计、品牌格式、收入平均值、最小值、最大值等。二、值百分比显示设置值字段,创建总计百分比字段。如上图,创建自那估计百分比字段后,就可以得到每一项占总计的百分比了,(即相当于

2021-11-03 15:31:15 11889

原创 Excel数据透视表经典教程九《数据透视表计算》

前言:本文介绍关于数据透视表计算的内容1、日期组合2、数值组合3、自定义组合4、计算字段5、计算字段的局限性6、计算项7、求解次序及列出公式一、日期组合1.1 查看各个品牌的收入(同时查看是收入的日期是什么时候)如上图,查看日期比较繁琐,可以通过组合日期。通过组合日期查看不同日期下的收入情况如下图:注:一般日期组合的方式为 ××年 ××季度 ××月1.2 组合日期并居中合并空白单元格最后操作结果如下:二、数值组合2.1、案例背景:统计班级不同分数段的学生个数。操

2021-11-02 16:53:35 3195

原创 Excel数据透视表经典教程八《创建单页/自定义字段透视表》

前言:一、单页字段透视表:当对多个表格进行数据透视分析时,不能直接点击插入数据透视表操作。因此,需要创建单页或者自定义字段透视表。二、自定义字段透视表:由于上述创建的单页字段透视表,对于不同的表格无法进行重命名,难以区分每一项所对应的表格。因此提出自定义字段透视表。一、单页数据透视表多个表格数据格式相同,内容不同。多三个(多个)表格进行数据透视。如下:创建新的表格按Alt+D+P出现创建单页数据透视表向导添加工作表得到单页字段透视表二、自定义字段透视表同样,按Alt+D+P出现创建

2021-11-02 01:03:42 3441

原创 Excel数据透视表经典教程七《刷新及更改数据源》

前言:一、刷新数据:当数据透视表对应的数据源发生变化后,数据透视表不会第一时间进行相应动态的更新。需要手动进行刷新。二、更改数据源:数据源的表格出现新增数据后,此时通过刷新数据也无法包含新的数据,因此需要更改数据源,重新选择数据源的表格区域。三、推迟布局更新:创建数据透视表后,由于数据量较大。拖动字段后数据透视表变换比较迟缓,且占用内存较大。可采用推迟更新的方法。一、刷新数据刷新前数据刷新后数据二、更改数据源数据源表格添加新数据更改数据源之后的数据透视表三、推迟布局更新更

2021-11-01 23:47:53 9255 1

原创 Excel数据透视表经典教程六《报表布局》

设置报表布局分类汇总、设置空行、总计一、以压缩形式显示以压缩的形式显示:如上图压缩显示的形式将父字段与子字段在一行进行进行显示,汇总值放在了最上方。压缩显示节省了横向的空间。二、以大纲形式显示2.1快速填充汇总字段下的空格以大纲形式显示数据:特点与压缩形式显示相似,大纲布局同样将汇总值放在最上方。三、以表格形式显示(常用)3.1 表格形式下填充总字段下空值以表格形式显示,对数据的布局比较明了,汇总值放在每以汇总项的下面,方便观看。因此,最常用的显示方式为表格形式显示。注:重复所有

2021-11-01 17:31:03 2363

原创 Excel数据透视表经典教程五《功能选项卡》

数据透视表功能选项卡介绍数据透视表创建完成之后,点击透视表中的任意单元格。上面会出现数据透视表分析和设计的两个上下文选项卡。一、数据透视表分析:针对数据透视表内部的功能。二、设计:针对的是数据透视表外观的功能。数据透视表分析部分:设计部分...

2021-11-01 16:00:30 1849

原创 Excel数据透视表经典教程四《多字段布局》

一、多字段布局以不同地区、城市、品牌的车进行数据透视分析1、查看不同品牌的销量2、查看每个品牌在不同城市中的销量3、查看不同地区下,不同品牌在不同城市的销量4、查看不同地区下城市,不同品牌的销量情况5、查看不同城市,对应地区,以及相应品牌的销量注:数据透视表中排在字段上面的字段是统筹下面内容的字段。即排在上面的字段是阅读者最先看到的内容。这里品牌表示的是总账科目,地区表示的明细科目这里地区为总账科目,品牌为明细科目二、父字段项与子字段项如上图,地区字段在城市字段上面,因

2021-11-01 01:39:41 1841

原创 Excel数据透视表经典教程三《数据透视表背后原理》

数据透视表原理一、当创建好数据透视表时,EXCEL会将数据源的数据复制一份到数据透视表的缓存里。相当于照片与数据本身的关系。所以透视表中的数据进行操作,不会影响到数据源的数值。二、这样做及保护了数据源,又比操作实际数据源的速度要快,占用内存少注意:修改数据源之后,不会立即在数据透视表中生效。(需要刷新)1、数据修改前的数据透视表2、数据修改后的数据透视表3、刷新数据透视表...

2021-10-31 16:08:23 2650

原创 Excel数据透视表经典教程二《创建数据透视表》

一、创建数据透视表由上图:Ctrl+A选中图表,然后点击插入—点击数据透视表选择在新/现有工作表中创建数据透视表1、对不同品牌下的不同车型进行计数2、查看不同品牌的收入是多少3、将不同的地区的品牌放在不同的表格下(分页浏览)...

2021-10-31 15:49:03 1293

原创 Excel数据透视表经典教程一《数据透视规范》

Excel用到数据透视表的情况如下:1、有大量的数据、使用函数计算慢,繁琐2、希望快速制作、整理、分析各种报表3、数据源经常发生变化、并且要经常分析和处理最新的数据4、想快速洞察数据背后隐藏的意义一、数据透视规范数据透视规范在通过现有表格创建数据透视表时,应注意表格内容和格式的一些规范:上图表格中存在一些数据透视不规范的地方:1、数据必须含有标题、且标题不能重复;2、不能出现合并单元格的情况3、不能有小计或者汇总4、不能出现空行5、数据类型必须一致二、处理表格中含有多个合并单元

2021-10-31 14:48:55 2446

原创 Django自学连载一(认识Django)

认识Django1. Django简介Django是什么?Django 是用Python开发的一个免费开源的Web框架,可以用于快速搭建高性能,优雅的网站!采用了MVC->MVT的框架模式。Django前景在Python中,与web开发相关的包有13045个,其中django就占了9091个,约70%。同时,Python中活跃的web框架多达54,其中最活跃的包括Django,flask等。Django便是其中的佼佼者,截至目前,已经有超过5200个中大型网站使用Django开发。比较知名的

2021-09-04 19:01:43 447

原创 Kaggle共享单车需求项目详解

Kaggle共享单车需求项目详解导入库%matplotlib inlineimport numpy as npimport pandas as pd from datetime import datetimeimport warningswarnings.filterwarnings('ignore')import matplotlib.pyplot as pltimport seaborn as snssns.set(style='whitegrid' , palette='t

2021-07-08 17:45:35 4169 1

原创 Kaggle房价预测详解

Kaggle房价预测详解导入数据查看各项主要特征与房屋售价的关系查看中央空调与售价关系查看装修水平与房价关系查看建造日期与售价关系不同地段与房价关系查看地皮面积与房价关系查看地下室总面积与房价关系导入数据导入库# 导入需要的模块import pandas as pdimport matplotlib.pyplot as pltimport numpy as npimport seaborn as sns # 离散统计分布以及连续统计分布from scipy import s

2021-07-05 12:49:32 11584 13

原创 Kaggle泰坦尼克号比赛项目详解

Kaggle泰坦尼克号比赛项目详解项目背景1、泰坦尼克号:英国白星航运公司下辖的一艘奥林匹克级邮轮,于1909年3月31日在爱尔兰贝尔法斯特港的哈兰德与沃尔夫造船厂动工建造,1911年5月31日下水,1912年4月2日完工试航。2、首航时间:1912年4月10日3、航线:从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,驶向美国纽约。4、沉船:1912年4月15日(1912年4月14日23时40分左右撞击冰山)船员+乘客人数:22245、遇难人数:1502(67.5%)目标根据

2021-06-28 14:50:47 3945 6

原创 不同k值对KNN算法预测准确率的影响

不同k值对KNN算法预测准确率的影响本文通过KNN算法对鸢尾花分类案例,通过尝试集不同的k值来查看预测准确率和误差率的情况from __future__ import print_functionfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn

2021-06-23 16:05:14 4922 1

原创 KNN算法解决鸢尾花分类案例

KNN算法解决鸢尾花分类案例本文分别通过KNN底层算法实现和sklearn中的KNeighbors Classifier(K近邻分类模拟)和对3中不同的鸢尾花的分类。一、K近邻(KNN)算法介绍二、KNN举例说明三、KNN举例计算四、KNN算法实现五、利用KNN算法实现鸢尾花分类案例案例背景说明:数据为sklearn自带的,数据集共有150条,其中数据data代表着鸢尾花的4个特征(花萼长度,花萼宽度,花瓣长度,花瓣宽度)。target表示鸢尾花的三种不同类型(setosa,vers

2021-06-23 15:34:14 10930

原创 梯度下降法求解线性回归

梯度下降法求解线性回归通过梯度下降法求解简单的一元线性回归分别通过梯度下降算法和sklearn的线性回归模型(即基于最小二乘法)解决简单的一元线性回归实际案例,通过结果对比两个算法的优缺。通过最小二乘法解决一元线性回归可以参考下面文章https://blog.csdn.net/coffeetogether/article/details/118114217数据源:链接: https://pan.baidu.com/s/1KVw_9O5o9vqQnpgRNfLGVQ提取码:8u8e一、梯度下降

2021-06-22 23:07:33 7980 5

原创 最小二乘法求解一元线性回归

最小二乘法求解一元线性回归介绍线性回归模型以及简单一元线性回归模型的解法。通过代码实现最小二乘法求解一元线性回归实例,并对结果进行预测。一、线性回归二、回归问题的解决三、最小二乘法介绍四、最小二乘法求解线性回顾五、实例验证案例背景:数据中参数x为学习时间,y为得分。通过最小二乘法求解参数w,b,均方差。并预测x=80时的得分。数据链接:链接: https://pan.baidu.com/s/1KVw_9O5o9vqQnpgRNfLGVQ 提取码:8u8e1.导入数据#

2021-06-22 20:25:23 4393 1

原创 泰坦尼克号幸存预测项目

泰坦尼克号幸存预测本次项目主要围绕Kaggle上的比赛题目: “给出泰坦尼克号上的乘客的信息, 预测乘客是否幸存” 进行数据分析。内容主要是通过jupter notebook,利用numpy,pandas,matplotlib三个库对乘客信息与幸存情况之间的研究。数据链接: https://pan.baidu.com/s/1gE4JvsgK5XV-G9dGpylcew提取码:y409目录1、项目背景2、数据概览3、特征分析4、特征工程5、构建模型1、项目背景泰坦尼克号: 是当时世界上

2021-06-19 22:52:40 2602 4

原创 电商销售数据分析项目

电商销售数据分析项目说明:项目通过jupter notebook。使用pandas,numpy,matplotlib等第三方库对某电子产品数据进行不同角度和指标上的分析。数据连接:链接: https://pan.baidu.com/s/1c3nRiGrx66RDPY93SUpWEA 提取码:2h89导入库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline#设置中文编

2021-06-18 15:40:33 2683 7

原创 淘宝用户行为分析项目

淘宝用户行为分析项目说明:本项目通过jupter notebook。使用pandas,numpy,matplotlib,seaborn等第三方库。对数据进行不同维度上的分析。一、项目背景本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析和用户价值RFM分析。二、数据源链接: https://pan.baidu.com/s/1468_ZeV0N_J1_FSyUgEMeQ提取

2021-06-18 10:25:18 1066 1

原创 Tableau插入自定义图片

Tableau插入自定义图片如何在Tableau中插入自定义图片解决方法:1.打开Tableau文件所在位置2.找到软件文件default>Shapes>image,添加自定义图片3.重启Tableau,即可使用自定义图片

2021-06-16 14:44:04 4950

原创 Tableau绘制符号地图、填充地图、多维地图、混合地图

Tableau绘制符号地图、填充地图、多维地图、混合地图导入数据1.绘制全球超市利润符号地图1.将地理位置名称拖进工作表(或详细信息)生成地图2.将利润拖进大小,国家地区名称拖进标签得到的符号地图,其中圆形符号的大小代表着国家超市利润的大小。导入数据2.绘制各省市售电量当期值填充地图1.将省市名称转换成地理角色,将省市拖进详细信息2.将当期值拖进颜色,将省市拖进标签得到填充地图颜色的深浅程度代表着售电量当期值得大小。3.绘制不同时期不同用电类别用电量多维地图1.绘制符号地

2021-06-16 14:25:28 2254

凯斯西储大学轴承故障数据

故障数据为采样频率为12KHZ的驱动端故障数据。 数据文件均为Matlab格式(.mat格式)。采样频率为12kHz。故障分别有内圈,外圈,滚动体等和每个数据标题中英文对应。 BA - 基座加速度数据(正常) DE - 驱动端加速度数据 FE - 风扇端加速度数据 time - 时间序列数据 RPM- 转每分钟 适用于通过方法或算法对数据分析从而对轴承故障进行识别。

2021-06-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除