自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 sql技巧:将空值替换为序列的上一个非空值

方法简要说明方法优势方法劣势方法1开窗函数直接取,需要忽略空值效率最高、代码量最少很多数据库语言不支持开窗函数里忽略空值方法2做分组的辅助列,再p_id,辅助列聚合开窗用max取代码量少,可读性好,执行效率高,几乎所有数据库都支持方法3在select后面取字段时,用子查询关联原表,并限制死只取1个值效率比较高,代码量较少很多数据库语言不支持方法4做分组的辅助列,将每个p_id对应的的dept合并为数组,然后再按辅助列的顺序将数组拆开。适用大多数sql数据库,执行效率还可以。

2023-12-09 19:18:24 1477

原创 Mysql时间操作总结

当前日期/时间当前日期+时间:now()当前日期:curdate()或者current_date()当前时间:current_timestamp()或curtime()或current_time()日期/时间增加或减少增加7小时以下都可以date_add(‘2021-01-01 12:00:00’,interval 7 hour)convert_tz(‘2021-01-01 12:00:00’, ‘+00:00’, ‘+07:00’)减少7小时date_add(‘2021-01-0

2022-03-23 00:05:26 1141

原创 在线教育公司指标体系-以某教育公司为例

最近想找教育行业的数据指标体系,但是几乎找不到,所以想先自己尝试建一个,因为学了开课吧的课程(那种不要钱的),对开课吧相对熟悉,所以就直接建立一套开课吧的数据指标体系。北极星指标首先找北极星指标。北极星指标需要判断公司处于什么阶段,对于开课吧,感觉上还处于成长期,有用户量增长的趋势,想找一些数据证实或证伪这个想法。找了酷传,找到了开课吧的安卓下载量数据,做了一个透视图,可以看出到今年三季度为止,下载量增长极为迅速,四季度即使考虑今年剩余20多天(打字日期是12月9日),相对于三季度也是略低的,当然这是

2021-01-05 14:30:38 2960

原创 数据可视化——图表类型选择

目录图表的功能性总结图表类型总结比较类柱状图​​​和柱状图变体本文借鉴了AntV的图表用法介绍:https://antv-2018.alipay.com/zh-cn/vis/chart/index.html,在此基础上,加入了自己的理解,剔除了我认为价值不大的图表类型和内容。数据可视化图表类型选择,需要从已有数据出发,考虑自己有什么数据,想要用数据图表做什么,也就是图表的功能。然后要考虑图表对使用者的理解能力要求,也就是可理解性。图表的功能性总结可视化图表所具有的功能有很多,

2021-01-03 22:00:43 11079

原创 学历教育项目用户(留资)特征体系总结

简单说下背景,我们一条产品线是学历提升,主要特点是高单价、转化周期长,用户通过我们的网络投放或者线下渠道,留下个人资料,每条用户资料我们简称为留资。我们目标是让留资数据尽可量丰富、准确、及时。对于留资特征,以下是我的总结。有些特征是已经能获取到且数据质量较好,还有些特征目前获取不到,只是一个思路。...

2020-09-23 17:50:10 773

原创 LendingClub贷款数据分析

开门见山目录:1 背景介绍2 基本数据处理3 公司总体分析4 贷款人分析5 用户特征与违约率的关系结论:没有特别提到年份的地方,默认是18年。公司:从贷款数量上来看,07年到15年,经营规模发展得很快,但是15年到18年,经营规模没有明显提高,尤其15年到17年,基本没有进步。13年的整体坏账率15.6%,13年到15年的3年期贷款坏账率逐年上升趋势明显。从贷款规模上看,公...

2020-03-08 21:29:43 5463 4

原创 如何在python中读取mysql中的数据并存为DataFrame

网上方法很多,我觉得这个是最简单的了。import numpy as npimport pandas as pdimport pymysqlfrom sqlalchemy import create_engine# 数据库类型+数据库驱动名称://用户名:口令@机器地址:端口号/数据库名engine = create_engine('mysql+pymysql://root:1234...

2020-03-03 17:14:33 842

原创 Pandas的DataFrame如何一列升序一列降序

Python的DataFrame如何一列升序一列降序df2 = pd.DataFrame({'a':[1,1,1,1,2,2,2,2], 'b':list(range(8)), 'c':list(range(8,0,-1))})print(df2)print(df2.sort_values(['a','c']))#多列...

2019-12-03 21:42:52 7411 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除