自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

转载 python中axis=0 axis=1的理解

轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。注意看,官方对于0和1的解释是轴,也就是坐标轴。而坐标轴是有方向的,所以千万不要用行和列的思维去想axis,因为行和列是没有方向的,这样想会在遇到不同的例子时感到困惑。根据官方的说法,1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,而体现出来的是列...

2020-05-04 14:56:35 257

原创 SQL刷题

1、按照dept_no进行汇总,属于同一个部门的emp_no按照逗号进行连接,结果给出dept_no以及连接出的结果employees:select dept_no,group_concat(emp_no)from dept_emp group by dept_no;2、获取Employees中的first_name,查询按照first_name最后两个字母,按照升序进行排列:selec...

2020-05-04 14:55:12 348

转载 偏态分布

一、总体介绍:频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。统计数据峰值与平均值相等的频率分布。偏态分布是指频数分布不对称,集中位置偏向一侧。统计数据峰值与平均值不相等的频率分布。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同...

2020-04-01 10:38:05 22822

原创 limit可以不offset

limit y : 读取 y 条数据limit x, y : 从索引号x开始,即第x+1条数据,读取 y 条数据,即跳过 x 条数据,读取 y 条数据,即limit y offset xlimit y offset x : 跳过 x 条数据,读取 y 条数据...

2020-03-30 15:54:08 120

原创 sqlzoo-join & self join

The JOIN operation第13题:答案:SELECTmdate,team1,SUM(CASE WHEN teamid=team1 THEN 1 ELSE 0 END)score1,team2,SUM(CASE WHEN teamid=team2 THEN 1 ELSE 0 END)score2FROM game LEFT JOIN goal ON matchid = i...

2020-03-30 14:03:48 119

转载 sort vs sorted

Python list内置sort()方法用来排序,也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。一、sort()使用sort()方法对list排序会修改list本身,不会返回新list,通常此方法不如sorted()方便,但是如果你不需要保留原来的list,此方法将更有效。注意:sort()不能对dict字典进行排序。二、sorted()对di...

2020-03-26 22:16:56 75

转载 事务

一、定义把多条语句作为一个整体进行操作的功能,被称为数据库事务。数据库事务可以确保该事务范围内的所有操作都可以全部成功或者全部失败。如果事务失败,那么效果就和没有执行这些SQL一样,不会对数据库数据有任何改动。二、特性:ACIDA:Atomic,原子性,将所有SQL作为原子工作单元执行,要么全部执行,要么全部不执行;C:Consistent,一致性,事务完成后,所有数据的状态都是一致的,...

2020-03-26 21:12:14 75

转载 事务的隔离级别

一、Read Uncommitted隔离级别最低。在这种隔离级别下,一个事务会读到另一个事务更新后但未提交的数据,如果另一个事务回滚,那么当前事务读到的数据就是脏数据,这就是脏读(Dirty Read)二、Read Committed在Read Committed隔离级别下,一个事务可能会遇到不可重复读(Non Repeatable Read)的问题。不可重复读是指,在一个事务内,多次读同...

2020-03-26 21:11:51 93

原创 消费频次与消费间隔

一、消费频次1、男女:平均只是一种参考指标2、年龄:二、消费间隔(类似生命周期)分组后的每组用户消费时间的最大值和最小值,也就是最后一次消费和第一次消费三、二八法则...

2020-03-26 17:47:58 2808

原创 复购率与回购率

一、复购率二、回购率最好设一个中间表

2020-03-26 16:16:34 2676

原创 mysql导入csv的4种报错

以此悼念一下我今天踩过的各种坑……场景一:local的错报错:ERROR 3948 (42000): Loading local data is disabled; this must be enabled on both the client and server sides修正:去掉localmysql> load data infile……场景二:csv地址错报错:ER...

2020-03-26 14:26:17 5696 1

原创 left right substr

SQL的left()、right() ≈ excel的left()、right()SQL的locate( , ,从哪个位置开始查找) ≈ excel的find()SQL的length() ≈ excel的len()substr(字符串, 从哪里开始, 截取长度)...

2020-03-26 09:47:46 108

原创 having vs where

一、用where:执行结果:where把电子商务的岗位提取出来,count(1)统计的是电子商务岗位的数量二、用having代替where:执行结果:having之后的count if 只是一个判断逻辑,count(1)依旧是指所有岗位的数量...

2020-03-26 09:47:12 125

原创 group by

group by 一般和聚合函数一起使用才有意义,比如 count、sum、avg等,使用group by的两个要素:(1) 出现在select后面的字段,要么是聚合函数中的,要么就是group by 中的(2) 要筛选结果,以先使用where,再用group by,或者先用group by 再用having在MYSQL中使用group by对表中的数据进行分组时,group by X:将...

2020-03-26 09:46:26 65

原创 sqlzoo-select within select

5、Germany (population 80 million) has the largest population of the countries in Europe. Austria (population 8.5 million) has 11% of the population of Germany.Show the name and the population of each...

2020-03-19 23:20:53 103

原创 当pip安装pyinstaller失败之后

一大片血红的报错…先按照提示更新了pip,然后按网上教的依次输入:(1)pip install pywin32(2)pip install wheel(3)pip install -U setuptools(4)pip install pyinstaller还是不行……最后只能手动安装……(1)下载安装包(极慢……):https://pypi.org/project/PyIns...

2020-03-16 18:53:44 205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除