自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Dataframe实用笔记

Dataframe实用笔记Dataframe查找和定位locilocDataframe查找和定位在一个Dataframe中根据需求查找某一列、连续的几列、间断的几列,某一行、连续的几行、间断的几行,某一个值、某几个值。定位函数:loc和iloc。locloc定位。ilociloc定位。.........

2020-09-27 19:29:05 718

原创 hive sql引入全局自定义变量

hive sql引入全局自定义变量。

2023-08-25 15:06:06 654

原创 问题聚集度Hive SQL

业务问题聚集度判断

2023-08-04 19:51:27 761 1

原创 实验评估相关笔记

实验评估相关笔记:最小样本量,实验检验

2023-02-17 11:34:55 235 1

原创 Kmeans+SVD趋势行为分析

Kmeans+SVD趋势行为分析

2022-09-14 18:07:31 431

原创 桑基图/Sankey图/标签流转图/特征流转

桑基图/Sankey图/标签流转图/特征流转

2022-08-09 11:43:21 342

原创 hive sql综合笔记

hive sql综合应用笔记

2022-07-06 21:28:22 621

原创 留存/复购cohort

目录留存cohort累计复购cohort留存cohort新用户留存cohort-- 留存cohortselect coh.pro_name ,coh.city_name ,coh.warehouse_code ,coh.warehouse_name ,coh.warehouse_type ,coh.agent_id ,coh.agent_name ,coh.moz_id ,coh.moz_name ,coh.fir_wk

2022-03-03 11:08:42 406

原创 指标异动的贡献度量化归因

目录背景目标方法思路子维度异动的贡献度量化指标类型一:加法指标类型二:乘法指标类型三:除法指标类型四:复合指标指标类型五:其他指标诊断展示结论背景数据监控,核心聚焦在子维度粒度数据波动的解读,但是不便于定位异常波动水平,以及进行指标下钻分析,难以直接定位指标变动来源。难以量化子维度贡献度例如:11点准时率下滑,但通过分省份数据很难直接各省份波动程度,也不便于定位各省份对11点准时率下滑影响。目标自动化实现指标异动监控预警及变化来源量化定位。方法思路确定各个维度层级异常预警逻辑,简单定位异常省份

2022-03-02 20:45:08 2925

原创 hive sql子查询循环调用

目录直接查询建表直接查询with usr_rd as(select tusr.*from ( select usr.dt ,usr.user_id ,usr.customer_type ,usr.moz_id ,usr.creat_date ,agt.supplier_id ,agt.supplier_na

2022-03-02 19:45:29 2289

原创 Matplotlib(4、双直方图) - plt.hist2d()参数解释&应用实例

matplotlib画双直方图 - plt.hist2d()一、plt.hist2d()参数详解简介:plt.hist2d():双直方图,双轴统计分布,效果类似于热力图。import matplotlib as mplimport matplotlib.pyplot as pltfrom matplotlib.pyplot import MultipleLocatorfrom matplotlib import ticker%matplotlib inlineplt.hist2d(x,

2021-02-21 23:29:35 5327 1

原创 Matplotlib(3、直方图) - plt.hist()参数解释&应用实例

matplotlib画直方图 - plt.hist()一、plt.hist()参数详解简介:plt.hist():直方图,一种特殊的柱状图。将统计值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。直方图也可以被归一化以显示“相对”频率。 然后,它显示了属于几个类别中的每个类别的占比,其高度总和等于1。import matplotlib as mplimport matplotlib.pyplot as pltfrom matplotlib.pyplot import

2021-02-21 23:15:04 112796 3

原创 Matplotlib(2、柱状图) - plt.bar()、plt.barh()参数解释&应用实例

matplotlib画柱状图 - plt.bar()一、plt.bar()参数详解import matplotlib as mplimport matplotlib.pyplot as pltfrom matplotlib.pyplot import MultipleLocatorfrom matplotlib import ticker%matplotlib inlinebar(x, height, width=0.8, bottom=None, *, align='center', d

2021-02-21 17:13:10 37147 6

原创 matplotlib笔记

Dataframe实用笔记1 指定位置进行文本标记使用中持续更新…1 指定位置进行文本标记指定位置进行文本标记法一:plt.text( )fig = plt.figure(figsize=(5,4), dpi=80)ax = fig.add_subplot(1,1,1)plt.subplot(1, 1, 1)plt.bar(data_all1_liucun.iloc[:, 0] - 0.006, data_all1_liucun.iloc[:, 4]/10000, color='lightb

2020-11-19 16:23:26 146

原创 聚类分析 / 分类分析

Kmeans二分kmeansKNNSVDNMFCEM

2020-10-19 15:10:30 1056

原创 hive SQL日期应用

hive SQL中日期的综合应用持续更新…锁定日期函数日期current_date今天的日期-- 上周末,至往前12周dt between date_sub(next_day(current_date,'MO'),91) and date_sub(next_day(current_date,'MO'),8)

2020-10-14 17:20:49 809

原创 XGBoost多分类模型实例(结合SHAP解释)

引言本文为实例,相关方法性说明参考:环境:Python 3.7平台:jupyterimport pandas as pdimport numpy as npimport matplotlib as pltfrom pylab import mplimport xgboost as xgbfrom xgboost import XGBClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.met

2020-10-10 20:55:51 10461 20

原创 XGBoost结合SHAP应用:回归、二分类、多分类模型

引言XGBoost用于建模,SHAP用户模型的可视化解释。XGBoost原理参考推荐:https://zhuanlan.zhihu.com/p/75217528SHAP原理参考推荐:https://blog.csdn.net/weixin_45520028/article/details/108857908XGBoost建模1 数据准备1 数据准备2 数据处理2 数据处理3 XGB模型3 XGB模型4 模型评估4 模型评估XGBoost使用笔记1 XGBoost模型参数解释

2020-10-09 14:32:21 10015 1

原创 shap学习笔记

shap学习笔记1 shap使用代码shap原理解释https://yq.aliyun.com/articles/760042?scm=20140722.184.2.173shap实用案例https://zhuanlan.zhihu.com/p/834123301 shap使用代码1 首先,准备好机器学习建模,如xgbtrain_x, test_x, train_y, test_y = train_test_split(data_input, data_result, test_size=0.

2020-09-28 21:25:02 4141

原创 xgboost踩坑笔记——shap.TreeExplainer(model)报错 ‘utf-8‘不能编码问题:utf-8 codec cant decode byte......

shap.TreeExplainer(model)报错 'utf-8’不能编码问题shap.TreeExplainer(model)运行报错:‘utf-8’ codec can’t decode byte 0xff in position 341: invalid start byteshap可以用于xgboost的模型可视化解释,很好用。报错原因:xgb版本问题,1.1.0及以上会出现,老版本不会。解决方法一重装xgboost至1.0.0版本解决方法二1 首先,xgb建模中有model

2020-09-28 15:13:37 2893 3

原创 xgboost踩坑笔记——macOS环境xgboost安装

xgboost安装建议从清华镜像源安装:pip install xgboost -i https://pypi.tuna.tsinghua.edu.cn/simple有的github特别墨迹,没问题的也可以安装git clone --recursive https://github.com/dmlc/xgboost

2020-09-27 23:46:32 1083

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除