自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 pivot_table-python

pd.pivot_table(data, values=None, index=None, columns=None, aggfunc=‘mean’, fill_value=None, margins=False, dropna=True, margins_name=‘All’)链接: link.图片: 带尺寸的图片: 居中的图片: 居中并且带尺寸的图片: 当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。如何插入一段漂亮的代码片去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同

2021-09-16 14:35:10 108

原创 合并表记录-Python

描述数据表记录包含表索引和数值(int范围的正整数),请对表索引相同的记录进行合并,即将相同索引的数值进行求和运算,输出按照key值升序进行输出。输入描述:先输入键值对的个数然后输入成对的index和value值,以空格隔开输出描述:输出合并后的键值对(多行)一.df.split(str,num)[n]:str分隔符,num分隔次数,n选取第n个分片二、a1,a2,…,an = input().split();用在接收多个用户输入的时候。(空格分开)三、zip()返回元祖函数n=int

2021-06-29 14:48:41 137

原创 取近似值-Python

写出一个程序,接受一个正浮点数值,输出该数值的近似整数值。如果小数点后数值大于等于5,向上取整;小于5,则向下取整。def func():num=float(int())res=num+0.5f=int(res)prtint(f)if_name_-==‘main’:func()...

2021-06-29 14:04:58 127

原创 费米估算问题

费米估算指的是解决未知结果的估算问题,将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,如果还不能得出结果,那就继续再拆解,直到拆解后的所有部分问题变成一个常识问题或者是比较容易解决的,从而将一个未知结果的问题逐步变得清晰。例如:芝加哥有多少钢琴调音师...

2021-06-22 15:12:22 169

原创 留存率-sql

留存率=某日登录用户数在之后第N日活跃用户数的比例关系已有表,注册表,登录表注册表信息:用户id,注册时间登录表信息:用户id,登录时间最终呈现表格字段|日期| 用户注册数|次日留存客户数|三日留存客户数|7日留存客户数|次日留存率|三日留存率|七日留存率用户注册数:select 注册时间,count(distinct (用户id)) as 用户注册数from 注册表group by 注册时间留存客户数:select 登录时间,count(distinct case when 时

2021-06-21 13:42:34 150

翻译 时间差函数-sql

MySQL的时间差函数TIMESTAMPDIFF、DATEDIFF的用法一、datediff函数,返回值是相差的天数,不能定位到小时、分钟和秒--相差两天select datediff('2018-03-22 09:00:00', '2018-03-20 07:00:00')二、TIMESTAMPDIFF函数,有参数设置,可以精确到天(DAY)、小时(HOUR),分钟(MINUTE)和秒(SECOND),使用起来比datediff函数更加灵活。对于比较的两个时间,时间小的放在前面,时间大的放在后面

2021-06-21 12:09:38 1347

原创 排名问题-sql

专用排名的窗口函数rank, dense_rank, row_number区别假设有字段:学号,班级,成绩select *, rank() over (order by 成绩 desc) as ranking, dense_rank() over (order by 成绩 desc) as dese_rank, row_number() over (order by 成绩 desc) as row_numfrom table;rank函数:如

2021-06-21 11:42:02 45

原创 面试思路-

一、准备好自我介绍二、准备好简历的项目1)项目中承担的责任2)遇到的问题,如何解决3)项目的成果三、面试过程中若面试官问到,某一指标下降的原因:1)核实数据是否真实2)同比,环比看数据是否异常,加入时间维度3)拆分指标,细化指标,找到原因(漏斗转化)4)考虑外部因素:有没有重大社会、经济事件干扰。5)内部原因:APP是否出现问题,bug导致用户体现下降。是否是优惠券等活动导致。四、数据常用的分析方法1)多维度拆解2)漏斗分析3)相关性分析4)假设检验5)A/B试验...

2021-06-21 11:31:13 36

原创 查找重复值-sql

实际业务场景,有用户id,查找有重复的用户id方法一、创建一个辅助表,将姓名列进行行分组汇总select id from(select id,count(1) as 计数 from table group by id)where 计数>1方法二、聚合函数条件select id from table group by id having count(id)>1...

2021-06-20 18:29:51 143

原创 零库存的实现

一、定义零库存:不以库存形式存在就可以免去仓库存货的一系列问题。二、模型**EOQ模型:**经济订货批量模型,又称整批间隔进货模型,该模型适用于整批间隔进货、不允许缺货的存储问题,即某种物资单位时间的需求量为常D,存储量以单位时间消耗数量D的速度逐渐下降,经过时间T后,存储量下降到零,此时开始定货并随即到货,库存量由零上升为最高库存量Q,然后开始下—个存储周期,形成多周期存储模型。经济订货批量模型最早由F.W.Harris于1915年提出的,该模型有如下假设:(1)需求率已知,为常量.年需求量以D

2021-06-20 16:51:57 1040

翻译 连续问题-sql

思路:当一个复杂问题需要多个子问题解决时,可以把每个问题写成一个子查询问题:有一张用户登录记录表,包含两个字段:用户id,日期,查询每个月,连续2个有登录的用户名单。

2021-06-11 11:36:54 70

翻译 分组聚合-sql

row_number over (parttion by colROW_NUMBER() OVER( [PARTITION BY column_1, column_2,…] [ORDER BY column_3,column_4,…])

2021-06-11 11:12:47 87 1

原创 First day

学习第一天,冲

2021-06-11 10:55:39 40

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除