自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 整理两道典型SQL问题回答思路

计算连续登录天数与留存率

2022-10-09 08:23:37 382 1

原创 SAS数据处理

学习处理

2022-08-29 00:46:05 724

原创 业务指标设计

数据分析师养成宝典一、 线下店铺1.营业额可比较分店、各员工能力2.分类货品销售额订货补货、区域对比3.前十大畅销款/滞销款设立库存安全线、搭配销售等4.连带率(销售件数/单数)低于1.3,应提升。例如陈列还有促销5.坪数低的原因 是否大部分陈列便宜的东西 黄金陈列位置6.人效7.客单价多定适合消费者承受力价位的;将高于平均单价的作特殊处理梅江平均单价作为订货参考8.货品流失率不见的9.存销比过高,资金效率低,过低,生意难以最大化。在3~4之间最合理。反映的是结构问题.

2022-04-12 09:13:41 257

原创 解决动态变化问题的SQL,涉及进入与离开 某一时刻最大观看人数

例题:每篇文章同一时刻最大在看人数问题来源牛客首先要将进入与离开分离,分别计数,再按时间排序即可这里便于理解用with函数分别写各个表with tmp1 as (select artical_id,in_time dt, 1 num from tb_user_log where artical_id!=0union select artical_id,out_time dt, -1 num from tb_user_log where artical_id!=0) select

2022-03-11 00:20:24 221

原创 Python矩阵相关

Python学得好费劲,基本记不住语法,每写一句就得查TT两列生成n*p维的全部数字为某数np.ones((n,p))#全为1np.ones(n,p)*5#全为5生成对角矩阵np.diag([1,2,3,4])依据协方差矩阵与均值生成随机多维正态向量np.random.multivariate_normal(mu,Sigma,n)#mu=[1,1] Sigma=np.ones((2,2))*rho+np.diag([1-0.5]*2) 0.5为rho乘积np.dot(a,b)

2022-03-02 21:17:40 536 1

原创 python出现‘Series‘ object has no attribute ‘sort‘

series 没有sort用法,需要series.sort_values()或者list(series).sort()

2022-02-28 19:17:01 1136

原创 python format格式报错时处理

print('众数:{0:.5f}'.format(mode))TypeError: unsupported format string passed to list.format改成 print('众数:{0}'.format(mode,'.5f'))即可不知道什么原因

2022-02-26 11:22:04 1909

原创 Python数据清洗

标题异常值的处理1.将异常值替换为空值,然后删除空值import pandas as pddata=pd.read_csv('E:\\Pylearning\\test.csv')print(data)data['价格'][data['价格']>1000]=Noneprint(data.dropna())2.将异常值替换为空值,然后进行数据插补data['价格'][data['价格']>1000]=Noneprint(data.fillna(data.mean()))乱码处

2022-02-05 15:03:42 1050

原创 Python爬虫基础知识

来自《Python爬虫、数据分析与可视化 从入门到精通》网页结构<div>定义了一个区块,表示在网页中划定一个区域来显示内容。分别用width与height来定义区块的宽与长,border定义区块边框的格式(粗细、线性、颜色)等,这些参数都存放在Style属性下.<ur>标签和<ol>标签分别用于定义无序列表和有序列表,<li>标签位于<ur>和<ol>标签之下,一个<li>表示列表中的一项,无序列表中默认为小圆点格

2022-02-01 13:54:47 2100

原创 Python正则表达式

普通字符含义\W匹配非数字、字母、下划线、汉字\W匹配数字、字母、下划线、汉字\S匹配任意非空白字符\s匹配空白字符\D匹配非数字\d匹配数字元字符在正则表达式中具有特殊含义的专用字符元字符含义.匹配任意字符(除换行符\r、\n)^匹配字符串的开始位置$匹配字符串的结束位置*匹配前一个字符的任意次数(包括0次)

2022-01-19 13:28:14 739

原创 MySQL中的细节问题

mysql学习过程中一些杂乱易忘易错知识。

2022-01-17 11:29:57 481

原创 MySql窗口函数学习

窗口函数排序项目场景:提示:这里简述项目相关背景:例如:项目场景:示例:通过蓝牙芯片(HC-05)与手机 APP 通信,每隔 5s 传输一批传感器数据(不是很大)问题描述:提示:这里描述项目中遇到的问题:例如:数据传输过程中数据不时出现丢失的情况,偶尔会丢失一部分数据APP 中接收数据代码:@Override public void run() { bytes = mmInStream.read(buffer); mHandl

2022-01-17 11:12:14 713

原创 MYSQL日期

学习来源网站-bilibili1.将字符串转变为日期str_to_date(string,format_mask)2.变化日期格式date_format(date,format)3.提取日期片段(年、月、周、日)year(current_Date)...4.时间平移本月的第一天date_format(current_date,'%Y-%m-01') 第几天数字就改成对应的本月的最后一天 last_ day(current_date)往前推两天date_add(current_day

2022-01-15 13:03:02 240

原创 python数据预处理

数据清洗缺失值处理,规范import pandas as pdfrom scipy.interpolate import lagrangeinputfile='E:/LearningSoftware/AboutPython/24064925aueh/01-数据和代码/chapter4/demo/data/catering_sale.xls'outputfile='E:/LearningSoftware/AboutPython/24064925aueh/01-数据和代码/chapter4/demo

2022-01-12 16:52:52 235

原创 Python主要数据探索函数

@Python主要数据探索函数基本统计特征函数pandas包中DataFrame或者Series普通公式d.sum() …sum可变化成mean var std corr cov skew kurt described拓展统计公式d.cumsum() 累计求和 cumpod 累计求积 cummax 前n个最大的数字rolling_sum(n)每n个数字求和,sum同样可变化成普通个数的统计作图#作图前import matplotlib.pyplot as pltplt.rcParams

2022-01-12 10:46:38 282

原创 mysql 字符串处理

`#连接SELECT concat(‘mysql’,‘8.0’)SELECT concat_ws(’-’,‘first’,‘second’,‘third’)#替换SELECT INSERT(‘Quest’,2,4,‘What’) as collselect lower (‘BEAUTIFUL’)select upper(‘baeutiful’)select left(‘football’,5)select right(‘football’,5)select LPAD(‘hello’,4,’

2020-10-25 11:28:56 169 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除