自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

转载 hiveSQL时间日期处理

1.将字符串日期转为整型日期hive数据库中存储的时间是string类型的,但是我们在取数的时候,习惯把字符串型的日期转换为整型的日期,如将’2020-09-03’转换成’20200903’,转换方式如下:(1)regexp_replace(substr(create_time,1,10),'-','')(2)regexp_replace(to_date(create_time),'-','')2.将整型日期转为字符串日期(1)将INT类型的日期值使用cast()函数转成STRING类型,用Hi

2021-06-28 14:48:47 6486 1

原创 【SQL】条件放on和where后的差别

sql中的连接查询分为3种, cross join,inner join,和outer join 。在 cross join和inner join中,筛选条件放在on后面还是where后面是没区别的;在outer join中,也就是平时最常使用的left join和right join,存在差别。outer join 的执行过程分为4步:1、先对两个表执行交叉连接(笛卡尔积)2、应用on筛选器3、添加外部行4、应用where筛选器一般会在第三步造成差别,下面为实例:1.student表:(

2021-05-13 10:31:43 466 2

转载 Pandas判断两列内容是否相同,并新建一列储存结果

首先写一个函数,实现判断是否相等的功能,如下:def function(a, b): if a == b: return 1 else: return 0用强大的 lambda 函数:df['bool'] = df.apply(lambda x : function(x['A'],x['B']),axis = 1)其中 A, B是需要比较是否相等的两列的列名。以上,新生成的 bool 列内容即是 0 和 1 用来表示 A 列和 B列是否相等。

2021-05-09 09:38:05 3602

原创 【MySQL】如何在SQLyog中导入CSV文件

Step 1 :在数据库中新建一个表,设置列名(与待导入文件一致)。Step 2 :右键表名,导入,导入使用本地加载的CSV数据:Step 3 :一定要指定转义字符,将终止设置为逗号,否则CSV所有值都会导入到第一列。...

2021-04-22 19:22:39 6482

原创 (七)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 7 业务分析报告与数据可视化报表

PART 7 业务分析报告与数据可视化报表(占比15%)总体要求理解业务分析报告与数据可视化报表的制作方法、能够结合业务需求撰写正确的业务分析报告,能够结合业务需求创建全面的数据可视化报表1、可视化分析图表(占比 5%)【领会】业务图表与统计图表的区别【熟知】业务图表决策树树状体系图中拆解上层指标依据:父子、逻辑、业务联系业务图形决策树将业务描述性分析中使用的图表分为了四个不同类别:构成类、对比类、序列类、描述类(描述结构,比较序列)熟知比较类图表的使用方法不..

2021-04-21 16:07:32 2074 3

原创 (六)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 6业务数据分析

PART 6 业务数据分析(占比 30%)总体要求理解业务数据分析方法、掌握业务数据分析流程、能够使用及设计创建业务指标、能够 结合业务模型及业务分析方法正确理解业务问题,找到问题原因,并能够提出解决问题建议1、数据驱动型业务管理方法(占比 3%)【熟知】熟知数据从业务中来到业务中去的全过程熟知数据驱动型业务管理的价值意义熟知数据驱动型业务管理流程熟知数据驱动型业务管理思维方式数据+经验决定业务策略,经验比数据更重要【应用】能够通过数据驱动型业务管理流...

2021-04-21 16:00:31 2374

原创 (五)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 5 多维数据透视分析

PART 5 多维数据透视分析(占比10%)总体要求理解多维数据模型价值、理解多维数据模型逻辑、理解透视分析原理、能够活用多维数据模型结合恰当透视方法观测业务问题实现商业洞察1、多表透视分析逻辑(占比 3%)【熟知】熟知透视分析的作用价值维度:行列标签理解多表环境下的连接、透视逻辑星型模式:由一个事实表和一组维度表组成,维度表只和事实表关联,维度表之间没有关联,以事实表为核心,维度表围绕核心呈星形分布。 订单表、产品表与客户表:一个事实表连接两个维...

2021-04-07 08:27:30 2812

原创 (四)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 4 描述性统计分析

PART 4 描述性统计分析(10%)总体要求理解统计基本概念、理解描述性统计相关知识内容、理解描述性统计图表定义及适用场 景、能够应用描述性统计知识描述及探索业务问题1、统计基本概念(占比 2%)【熟知】统计学含义及其应用统计学的基本概念:数据、总体、样本、参数、变量2、数据的描述性统计(占比 3%)【领会】描述性统计图表:直方图、散点图、箱型图(盒须图)盒须图(⼜称箱线图)相对于直⽅图⽽⾔,提供的信息更精炼。它提供了中位数、均值、上下分位点的信息,这不但可以.

2021-04-05 16:26:22 1498

原创 (三)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 3 数据库应用

PART 3 数据库应用 (占比 17%)总体要求理解数据库的基本概念、理解 DDL 及 DML 语言、能够根据业务需求及数据特征使用查询语言从数据库中获取准确、完整的数据信息、能够应用数据库函数进行数据处理及计算1、数据库相关概念(占比 1%)【领会】数据库分类数据库的功能定位:OLTP数据仓库的功能定位:OLAP联机事务处理 ( OLTP ) 系统旨在针对小工作单元进行快速写入,例如,用于快速创建单个事件。联机分析处理 ( OLAP ) 数据仓库旨在促进跨大型数据集...

2021-04-05 16:12:05 2034 1

原创 (二)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 2 数据结构

PART 2 数据结构(占比 15%)总体要求理解表格结构与表结构的数据特征、理解表结构与表结构数据获取操作方法、理解表结构数据连接及汇总的逻辑、能够应用表结构连接及汇总逻辑关联多表进行汇总求值计算、能够制作 ER 关系图1、表格结构数据特征(占比 2%)【领会】表格结构数据概念表格结构数据处理工具EXCEL、Numbers、WPS【熟知】表格结构数据特征1.以单元格为基本数据存储及操作单位2.处理批量数据效率低可以引用其他工作表和工作簿中的单元格值进行计算

2021-04-05 15:36:08 2789

原创 (一)CDA 数据分析师Level1考试新版大纲解析(自己整理)PART 1 数据分析概念与职业操守

PART 1 数据分析概念与职业操守1、数据分析概念、方法论、角色(占比 1%)【领会】数据分析基本概念(数据分析、数据挖掘、大数据) 数据分析目的及其意义数据分析(Data Analysis):是以数据为分析对象,以探索数据内的有⽤信息为主要途径,以解决业务需求为最终⽬标,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应⽤等步骤在内的⼀整套分析流程。数据挖掘(Data Mining) : 是⼀个跨学科的计算机科学分⽀,它是⽤⼈⼯智能、机

2021-04-05 15:26:20 3561

原创 【Tableau】Tableau连接mysql

Tableau数据源中点击连接,可选择不同的数据源。选择MySQL,未下载驱动应先直接按提示下载驱动。TCP/IP server:个人学习使用一般是localhostport:3306user和password这个自己都可以设置,如果在安装mysql时没有设置账户和密码一般账户是root连接成功!...

2021-04-03 10:53:36 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除