- 博客(8)
- 问答 (10)
- 收藏
- 关注
原创 Tableau作图之空心环形图
在Tableau中作饼图很容易,使用系统自带的智能推荐图形即可。以Tableau中超市数据源为例,我们先来做一个区域销售额占比的饼图。接下来我们将这个饼图改造成一个空心环形图。S1.行上新增0,形成0轴S2,复制行上的0S3.将下边的圆环标记卡里的胶囊全部拖走,并将填充颜色设置为白色S4.调整上下两个饼的大小,确保上边的饼比下边的饼大S5.右击第二个0元素,设置双轴,这样我们就得到了一个空心环形占比图。...
2021-11-18 18:20:38 728
原创 Python pandas groupby函数给用户贴商品标签
在以上订单表中,需要给每位用户贴上购买的商品名称标签和总的实付款金额标签。这里需要注意的是如果某位用户多次购买同一商品,标签中只需要保留一次该商品名称。下面通过pandas 的groupby函数实现该效果。#订单数据读取import pandas as pdimport numpy as npfile_path=r"E:\临时\20211118\订单数据.xlsx"data=pd.read_excel(file_path)#订单数据前5行打印data.head()#通过grou.
2021-11-18 14:08:27 1036
原创 Python pandas使用pivot_table时由于index存在nan值,导致该行记录未被记录
Python pandas 的pivot_table可以实现与Excel透视表类似的效果,但是如果index参数列中存在Nan值,就会导致改行记录不被计入。result=data.pivot_table(index=["商家名称","月份","活动类型","满减门槛","满减金额"],values=["补贴金额","原价"],aggfunc={"补贴金额":np.sum,"原价":np.sum}).reset_index()#因满减门槛及满减金额存在Nan值,导致pivot_table的结果并不准确目
2021-11-18 11:22:07 2332
原创 Mysql-使用row_number() over()函数求每组的最低分
之前我写过不用函数求分组后每组销量前两名的方法,可以参考这一篇。这种方式会稍微复杂一些。Mysql-group by分组后取每组销量前两名刷牛客网后,发现可以使用row_number() over()函数快速查出每组的最低分。select device_id,university,gpafrom (select *,row_number() over (partition by university order by gpa) as rnfrom user_profile) as univ
2021-11-05 18:27:35 493
原创 Mysql-统计用户的次日留存率
刷牛客网上遇到的一题,看了讨论区的内容,现在把自己的理解记录下来。题目要求:解题思路:1.一个用户可能一天内存在多次答题记录,以device_id,date去重select distinct q.device_id,q.datefrom question_practice_detail q2.单个用户的次日留存率假设某用户11月1日答完题后,11月2日继续登录答题,11月3日也继续登录答题。那一共可以查到3条该用户的去重记录,其中11月2日、11月3日均是次日留存记录,这里我们的次日留
2021-11-03 23:23:24 1706 1
原创 Mysql-字符串分列后取指定位置的值
如何取出上表中的性别?首先我们想到用substring_index()来进行分列#错误示例substring_index(profile,",",4)#最后取出的不是我们想要的性别,而是整个profile字段,参数4代表从左往右前4个分列的值#正确示例substring_index(profile,",",-1)#最后参数-1,代表从右往左数第一个分列的值...
2021-11-03 22:58:17 292
原创 Msql-构造当日同比日期
##当期销售金额selectSUM(ls.sale_amount) from test_sale_amount lswhere ls.order_date>="2021/11/1"and ls.order_date<=CURDATE()##同比期销售金额select SUM(ls.sale_amount) from test_sale_amount lswhere ls.order_date>="2020/11/1"and ls.order_date<=c
2021-11-03 15:55:58 93
原创 Python pandas分组后取每组排名前三的记录
源数据如上所示,需要输出每个城市销售额排名靠前的三家零售商。具体做法如下:S1:读取文件#读取源数据文件import pandas as pdfile_path=r"E:\临时\20211103\temp.xlsx"data=pd.read_excel(file_path)S2:降序排序#以城市和销售额为基准进行降序排序data_sort=data.sort_values(by=["城市","销售额"],ascending=[False,False])S3:分组后取每组排名前三的.
2021-11-03 15:44:14 7670
空空如也
连接局域网里的服务器被拒绝怎么办?
2017-05-18
用Matlab的高斯滤波简单处理图像,存储时出现异常。
2017-04-12
无参考图像模糊度评估数据集中的图片需要lable吗?
2017-03-26
如何将二进制文件编译位ascii文件
2017-03-26
lua中如何解压文件?调用os.execute('unzip filename')报错
2016-05-23
torch7中用toch.load()加载文件报错
2016-05-21
torch7中如何加载bmp格式的图片?
2016-05-15
torch7中require 'graphicsmagick'报错
2016-05-14
torch7搭建时luarocks install cutorch 报错
2016-05-13
虚拟机ubuntu系统ip问题
2016-05-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人