且行且安~
擅长路径规划、车间调度、港口调度、排班调度等OR优化领域以及机器学习及数分领域,合作需求请见推广栏,请备注来意,不然不通过!
展开
-
数据分析学习目录
如下为数据分析的整个目录一、数据分析思维二、数据分析中常用的Excel技巧三、MySQL编程四、可视化BI软件五、大数据六、数据分析的编程基础七、统计学理论八、数据挖掘九、数据分析项目............................................................原创 2022-04-21 22:02:38 · 2549 阅读 · 0 评论 -
MySQL核心查询【1】单表查询与SQL约束
上一小节重点针对简单的增删改查做了讲解汇总,本小节将进入SQL查询的核心阶段,主要是排序查询、分组查询、聚合查询以及分页查询,最后在文章的末尾也讲解了SQL的相关约束,为讲解多表查询打下基础。1、排序查询如果我们需要对读取的数据进行排序,我们就可以使用 MySQL 的 order by 子句来设定你想按哪个字段哪种方式来进行排序,再返回搜索结果。(排序只是显示效果,不会影响真实数据)。原创 2022-05-04 22:06:14 · 769 阅读 · 0 评论 -
Mysql的增删改查
数据库SQL语句操作详解。原创 2022-04-30 09:55:27 · 677 阅读 · 0 评论 -
指标体系搭建-专项1
指标体系的重要性不言而喻。那么,为什么需要指标体系?什么是指标体系?如何建立指标体系?本篇文章里将从这几个方面介绍指标体系的基本概念和构建方法原创 2022-08-30 23:23:48 · 297 阅读 · 0 评论 -
数据分析思维模型和方法
数据分析从入门到进阶很重要的一个就是分析方法和思维,这个可以说是数据分析的底层能力。数据分析是一种能力,任何岗位都应该具备一定的分析方法和思维。原创 2022-08-22 23:10:19 · 239 阅读 · 0 评论 -
数据异常问题分析方法
对于数据分析师而言,监控日常指标数据是必不可少的工作,数据异常分析也是数据分析工作中最常见且重要的分析主题。且指标异动问题也是面试的高频考点。原创 2022-08-18 00:27:16 · 796 阅读 · 0 评论 -
计数的窗口函数应用(2)
计数的窗口函数应用(2)原创 2022-08-11 22:52:51 · 468 阅读 · 0 评论 -
求和、计数的窗口函数应用
求和、计数的窗口函数应用原创 2022-08-10 22:54:30 · 587 阅读 · 0 评论 -
SQL外连接之交集、并集、差集查询
SQL外连接之交集、并集、差集查询原创 2022-08-05 00:23:19 · 4341 阅读 · 0 评论 -
用户考试分数大于单科科目平均分的查询
用户考试分数大于单科科目平均分的查询原创 2022-08-04 21:13:25 · 338 阅读 · 0 评论 -
数分面试(一)----与业务相关
现定为新用户第一次登录时间为第0天,新用户定义为第一次登录的用户,登录行为的代号为1。次日留存率:第0天新增用户中,新增日之后的第1天还登录的用户数 / 第0天新增总用户数;7日留存率:第0天新增用户中,新增日之后的第7天还登录的用户数 / 第0天新增总用户数;30日留存率:第0天新增的用户中,新增日之后的第30天还登录的用户数 / 第0天新增总用户数;...原创 2022-08-02 23:00:21 · 209 阅读 · 0 评论 -
子查询作为检索表时的不同使用场景以及是否需要添加别名的问题
子查询主要分为以下三种情况,其中对应的情况如下: 1.单行单列 也就是结果是一个的 例如 1,此种情况不需要起别名 2.多行单列 也就是结果是一组数据的 例如(1,2,3),此种情况不需要起别名 3.多行多列 也就是结果是一张表,此种情况需要起别名,才能访问表中字段......原创 2022-07-28 00:12:17 · 898 阅读 · 0 评论 -
MySQL之分组查询group by
Mysql分组查询内容的补充完善,工作中经常会遇到分组查询的情况,一般情况下,分组查询是必须要与聚合函数在一起使用的,不然单独使用没有意义,这是很多刚入门的同学的常常犯的错误。可以翻看前面讲述的mysql的分组查询的文章...原创 2019-06-16 18:24:18 · 1096 阅读 · 0 评论 -
格式错误的转换处理(含日期格式以及编码格式错误)
在工作中,碰到了load CSV文件时,日期格式读写错误的情况,CSV文件的日期格式显示为date的格式,即为yyyy-MM-dd hh:mm:ss,但hive在读取日期格式的数据时,自行转换成了yyyy/MM/dd的这种字符串格式。原创 2022-05-28 08:48:47 · 2152 阅读 · 0 评论 -
Mysql重点难题(2)汇总
mysql的重点难题汇总原创 2022-07-02 00:54:21 · 196 阅读 · 0 评论 -
jupyter notebook的插件安装以及快捷键
jupyter notebook的插件安装以及快捷键原创 2022-06-26 00:36:16 · 270 阅读 · 0 评论 -
Mysql触发器
触发器,就是一种特殊的存储过程。触发器和存储过程一样是一个能够完成特定功能、存储在数据库服务器上的SQL片段,但是触发器无需调用,当对数据库表中的数据执行DML操作时自动触发这个SQL片段的执行,无需手动条用。 ②在MySQL中,只有执行insert,delete,update操作时才能触发触发器的执行 ③触发器的这种特性可以协助应用在数据库端确保数据的完整性 , 日志记录 , 数据校验等操作 ④使用别名 OLD 和 NEW 来引用触发器中发生变化的记录内容...原创 2022-06-21 00:26:01 · 162 阅读 · 0 评论 -
Mysql索引
索引是存储引擎用来快速查找记录的一种数据结构,按照实现的方式类分,主要有Hash索引和B+Tree索引 B+Tree索引 创建主键索引的方式常常有两种②修改表结构 添加主键索引 4.4.2、唯一索引(UNIQUE)(了解)特点: 索引列的所有值都只能出现一次, 必须唯一. 唯一索引可以保证数据记录的唯一性。 事实上,在许多场合,人们创建唯一索引的目的往往不是为了提高访问速度,而只是为了避免 数据出现重复。...原创 2022-06-19 15:52:25 · 178 阅读 · 0 评论 -
Hadoop MapReduce入门
入门简介计算过程分为两个阶段Map 和 Reduce Map 阶段并行处理输入数据 Reduce阶段对Map结果进行汇总针对python语言来说: map函数或者reduce 函数来说,输出的数据格式为元组tuple一个简单的 MapReduce 程序只需要指定 map() reduce() input() ......原创 2018-11-13 19:35:55 · 353 阅读 · 0 评论 -
Hadoop及Hive环境介绍
重点讲述Hadoop及Hive的环境介绍,主要的内容包含有分布式文件系统[HDFS] 、分布式计算(MapReduce)、数据仓库工具(Hive)、数仓分层 等相关的知识原创 2022-06-10 23:59:28 · 302 阅读 · 0 评论 -
MySQL优化的方法
SQL的优化属于一个持续性的改善,后续再有改善的方法会加入进来。原创 2022-05-30 00:27:13 · 249 阅读 · 0 评论 -
MySQL实现商品协同过滤系统推荐
在讲解该项目之前,我们先了解下,协同过滤的常规业务场景与作用。你想想抖音里,你看的小说里,是不是会发现你喜欢的内容都几乎比较同质化,或同类化,这都是商家在后台进行了一定的用户画像以及使用了一定的推荐算法来实现的,本文不在于讲解推荐算法,重在讲解以推荐算法的数学模型的基础上以MySQL的方式来进行数据分析。当数据量大到一定程度后,往往会采用Hive或者MySQL数据库存储数据,数据量较大时,往往在使用编程语言读取内容会较为吃力,故本文在以MySQL的视角下分享协同过滤的问题。原创 2022-05-25 00:59:36 · 442 阅读 · 0 评论 -
MySQL函数【2】之高阶窗口函数的应用
上一章节讲述了MySQL函数的基础应用,包括数学函数、日期函数、字符串函数、条件判断函数以及系统函数,本小节将会讲述函数查询的大杀器----高级窗口函数,若是在面试过程中考到了SQL问题,窗口函数是必会被提问的,所以窗口函数在SQL中的地位就举足轻重,是必须且重点掌握其使用方法。原创 2022-05-15 03:24:17 · 292 阅读 · 0 评论 -
MySQL函数【1】之基础应用
前面章节讲述了MySQL的增删改查功能,其中针对Mysql的查询做了非常详细的梳理与介绍,在掌握基本的Mysql语法以后,我们接下来将会重点对于常用到的Mysql函数以及核心大招函数--高级的窗口函数进行讲解,相信学完本小节,你基本可以应对绝大多数的业务场景了。前面章节讲述了MySQL的增删改查功能,其中针对Mysql的查询做了非常详细的梳理与介绍,在掌握基本的Mysql语法以后,我们接下来将会重点对于常用到的Mysql函数以及核心大招函数--高级的窗口函数进行讲解,相信学完本小节...原创 2022-05-13 00:35:26 · 228 阅读 · 0 评论 -
数据分析大厂面试真题汇总
这里我将面试的类别分为3类,一是统计学知识相关的面试,二是SQL相关的面试,三是业务分析与业务理解层的面试。原创 2022-05-12 23:59:41 · 521 阅读 · 0 评论 -
MySQL核心查询【2】多表查询
上一章节讲述了MySQL核心查询【1】之单表查询以及单表与多表之间的关系约束,本章节就能顺理成章的过渡到多表查询。连接是关系数据库模型的主要特点。连接查询是关系数据库中最主要的查询,主要包括内连接、外连接等。通过连接运算符可以实现多个表查询。在关系数据库管理系统中,表建立时各数据之间的关系不必确定,常把一个实体的所有信息存放在一个表中。当查询数据时,通过连接操作查询出存放在多个表中的不同实体的信息。当两个或多个表中存在相同意义的字段时,便可以通过这些字段对不同的表进行连接查询。本节将...原创 2022-05-09 01:29:34 · 348 阅读 · 0 评论 -
Mysql重点难题(1)汇总
Mysql重点难题原创 2022-05-08 18:03:52 · 354 阅读 · 0 评论 -
Tableau之数据融合4.1.4
在Tableau数据融合中主要分为3种情况,分别是数据连接、数据合并与数据混合。原创 2022-04-26 20:28:43 · 344 阅读 · 0 评论 -
工作中Excel常用的函数汇总2.1-2.8
以下一些为自己在工作中真实遇到的案例,这里只讲方法,出于学习与分享,前面的2.1--2.7汇总了工作中常用的且具有实际业务意义的一些函数。其中在2.8小节分享了所有的Excel函数语法与应用的汇总表,超硬核!85个Excel函数的学霸笔记,工作中万能场景随便秒杀,学完你也会秒表Excel大神,附在文章末尾,想要的请自行获取即可。后续有时间会继续针对Excel表格的美化做出进阶分享。包括炫酷的饼图、特殊控件图表,滑块条形图,以及动态折线图、仪表盘、气球图,动态仪表板,暂时会分享出控件组套形成的动态仪表板原创 2019-06-11 16:14:58 · 1877 阅读 · 1 评论 -
Mysql中字符串提取函数substring以及substring_index
如下重点讲述数据库Mysql中,字符串的两个函数用法,主要用于提取字符串。1、substring()函数作用:从具有特定长度的位置开始提取一个子字符串。SUBSTRING(string,position)有两个参数:string参数是要提取子字符串的字符串。position参数是一个整数,用于指定子串的起始字符,position可以是正或负整数。如果position为正,则SUBSTRING函数从字符串的开始处提取子字符串。请参阅以下字符串。例如,要从“MySQL SU原创 2022-04-10 19:13:34 · 736 阅读 · 0 评论 -
电商领域用户的留存分析
电商领域用户的留存分析原创 2022-04-09 19:43:50 · 1470 阅读 · 0 评论 -
网站用户的消费趋势及行为分析
主要内容:1、导入第三方库及数据、观察数据、修改数据类型2、用户消费的趋势分析每月的消费总金额及其变化趋势 每月的消费次数及其变化趋势 每月的消费人数 每月用户平均消费金额的趋势 每月用户平均消费次数的趋势3、用户个体消费分析用户消费金额、消费次数的描述统计 用户消费金额的分布图 用户消费的商品数的分布图 用户消费金额和商品数的散点图4、用户消费行为分析用户第一...转载 2019-06-28 21:20:14 · 437 阅读 · 0 评论 -
网站用户的消费趋势及行为分析
该数据来源于某网站的消费记录,现针对该数据对用户的消费趋势及消费行为进行分析。链接:https://pan.baidu.com/s/17I7JN579RZS6zvsJCWHOug 提取码:ydqa本篇文章仅供学习,其思路方法具有很强的借鉴性,转载于简书,如给作者带来不便,可联系博主删除作者:Runningbetter链接:https://www.jianshu.com/p/9fb07e...转载 2019-06-28 16:18:27 · 1919 阅读 · 0 评论 -
数据规整化(二)
在处理数据表的时候,经常需要处理字符型的数据,而pandas中的Series.str属性就有几下方法可以处理字符串数据。Series类的str自带的方法如下:1、cat() 拼接字符串 例子: >>> Series([‘a‘, ‘b‘, ‘c‘]).str.cat([‘A‘, ‘B‘, ‘C‘], sep=‘,‘) 0...原创 2018-07-29 17:18:31 · 309 阅读 · 0 评论 -
【机器学习】数据清洗常用的函数汇总
目录数据规整化:合并、清理、过滤1) merge()函数参数----合并数据集2) pandas 的value_counts()函数----对Series里面的每个值进行计数并且排序3)astype()--修改列类型4) 字符替换的方法5)成员判定6)判断DataFrame中是否有缺失值7) DataFrame.sort_values原创 2018-07-29 14:35:55 · 3374 阅读 · 0 评论