自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 问答 (10)
  • 收藏
  • 关注

原创 Tableau作图之空心环形图

在Tableau中作饼图很容易,使用系统自带的智能推荐图形即可。以Tableau中超市数据源为例,我们先来做一个区域销售额占比的饼图。接下来我们将这个饼图改造成一个空心环形图。S1.行上新增0,形成0轴S2,复制行上的0S3.将下边的圆环标记卡里的胶囊全部拖走,并将填充颜色设置为白色S4.调整上下两个饼的大小,确保上边的饼比下边的饼大S5.右击第二个0元素,设置双轴,这样我们就得到了一个空心环形占比图。...

2021-11-18 18:20:38 728

原创 Python pandas groupby函数给用户贴商品标签

在以上订单表中,需要给每位用户贴上购买的商品名称标签和总的实付款金额标签。这里需要注意的是如果某位用户多次购买同一商品,标签中只需要保留一次该商品名称。下面通过pandas 的groupby函数实现该效果。#订单数据读取import pandas as pdimport numpy as npfile_path=r"E:\临时\20211118\订单数据.xlsx"data=pd.read_excel(file_path)#订单数据前5行打印data.head()#通过grou.

2021-11-18 14:08:27 1036

原创 Python pandas使用pivot_table时由于index存在nan值,导致该行记录未被记录

Python pandas 的pivot_table可以实现与Excel透视表类似的效果,但是如果index参数列中存在Nan值,就会导致改行记录不被计入。result=data.pivot_table(index=["商家名称","月份","活动类型","满减门槛","满减金额"],values=["补贴金额","原价"],aggfunc={"补贴金额":np.sum,"原价":np.sum}).reset_index()#因满减门槛及满减金额存在Nan值,导致pivot_table的结果并不准确目

2021-11-18 11:22:07 2332

原创 Mysql-使用row_number() over()函数求每组的最低分

之前我写过不用函数求分组后每组销量前两名的方法,可以参考这一篇。这种方式会稍微复杂一些。Mysql-group by分组后取每组销量前两名刷牛客网后,发现可以使用row_number() over()函数快速查出每组的最低分。select device_id,university,gpafrom (select *,row_number() over (partition by university order by gpa) as rnfrom user_profile) as univ

2021-11-05 18:27:35 493

原创 Mysql-统计用户的次日留存率

刷牛客网上遇到的一题,看了讨论区的内容,现在把自己的理解记录下来。题目要求:解题思路:1.一个用户可能一天内存在多次答题记录,以device_id,date去重select distinct q.device_id,q.datefrom question_practice_detail q2.单个用户的次日留存率假设某用户11月1日答完题后,11月2日继续登录答题,11月3日也继续登录答题。那一共可以查到3条该用户的去重记录,其中11月2日、11月3日均是次日留存记录,这里我们的次日留

2021-11-03 23:23:24 1706 1

原创 Mysql-字符串分列后取指定位置的值

如何取出上表中的性别?首先我们想到用substring_index()来进行分列#错误示例substring_index(profile,",",4)#最后取出的不是我们想要的性别,而是整个profile字段,参数4代表从左往右前4个分列的值#正确示例substring_index(profile,",",-1)#最后参数-1,代表从右往左数第一个分列的值...

2021-11-03 22:58:17 292

原创 Msql-构造当日同比日期

##当期销售金额selectSUM(ls.sale_amount) from test_sale_amount lswhere ls.order_date>="2021/11/1"and ls.order_date<=CURDATE()##同比期销售金额select SUM(ls.sale_amount) from test_sale_amount lswhere ls.order_date>="2020/11/1"and ls.order_date<=c

2021-11-03 15:55:58 93

原创 Python pandas分组后取每组排名前三的记录

源数据如上所示,需要输出每个城市销售额排名靠前的三家零售商。具体做法如下:S1:读取文件#读取源数据文件import pandas as pdfile_path=r"E:\临时\20211103\temp.xlsx"data=pd.read_excel(file_path)S2:降序排序#以城市和销售额为基准进行降序排序data_sort=data.sort_values(by=["城市","销售额"],ascending=[False,False])S3:分组后取每组排名前三的.

2021-11-03 15:44:14 7670

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除