自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(124)
  • 资源 (1)
  • 收藏
  • 关注

原创 python 总结

python知识总结

2022-05-07 20:35:29 900

原创 零碎知识总结

文章目录零碎知识——业务零碎知识——AB实验零碎知识——Python零碎知识——统计相关零碎知识——机器学习零碎知识——sql相关零碎知识——业务零碎知识——AB实验零碎知识——Python零碎知识——统计相关零碎知识——机器学习零碎知识——sql相关...

2022-03-13 21:30:04 2613

原创 机器学习笔记总结

线性回归模型详解方差分析聚类分析PCA——主成分分析机器学习笔记一——感知机机器学习笔记二——k近邻机器学习笔记三——决策树机器学习笔记四——SVM机器学习笔记五——EM算法与高斯混合模型模型融合之BoostingXGBoost面试题因果推断学习笔记一因果推断学习笔记二因果推断学习笔记三——Uplift模型...

2021-07-30 10:00:25 1443

原创 概率论与数理统计复习笔记总结

一、概率论复习笔记概率论复习笔记一——伯努利实验及相关的概率分布概率论复习笔记二——离散型分布和连续型分布概率论复习笔记三——随机向量,随机变量的独立性概率论复习笔记四——期望、方差、协方差与相关系数概率论复习笔记五——大数定律和中心极限定理二、数理统计复习笔记数理统计复习笔记一——统计中常用的抽样分布(卡方分布,t分布,F分布)数理统计复习笔记二——充分统计量数理统计复习笔记三——点估计数理统计复习笔记四——区间估计数理统计复习笔记五——假设检验之显著性检验数理统计复习笔记六——P

2021-07-29 18:46:41 3935

原创 mysql语句思维导图

mysql思维导图

2022-07-10 11:52:41 590 2

转载 数据分析思维之数据分析报告

文章目录一、你问我答型报告1.1 初级报告1.2 中级报告1.3 高级报告二、该怎样汇报分析报告?2.1 第一次汇报2.2 平安无事汇报2.3 问题点汇报2.4 总结性汇报一、你问我答型报告1.1 初级报告三个问题:昨天的销售业绩是多少?明天的销售业绩是多少?今天的销售业绩是多少?一问一答,正面回答,简单清晰。问题1:昨天的销售业绩是1000万。OK,过关。问题2:注意时间状态。明天,是还没有发生的,因此是个预测值。涉及预测,就得讲清楚:预测方法、预测依据、预测结果。问题3:今天

2022-05-29 11:27:56 438

转载 数据分析思维之用户画像报告

1. 没用的分析报告2. 为什么没用?3. 如何提高报告有用性?

2022-05-29 10:18:56 535

转载 数据分析思维之用户标签

用户标签

2022-05-19 18:09:32 1681

转载 数据分析思维——数据分析方法

数据分析思维——数据分析方法

2022-05-19 08:47:55 613

原创 pandas之处理时间序列数据

pandas中的时间序列数据

2022-04-09 21:39:57 3686

原创 pandas之stack和unstack

pandas之stack和unstack

2022-04-08 15:25:08 1396

原创 pandas之合并数据集

pandas合并数据集的三种方法

2022-04-08 14:25:58 1573

原创 数据清洗之字符串操作和正则表达式

字符串对象方法正则表达式re库

2022-04-08 13:56:56 1217

原创 数据处理之数据转换

数据处理之数据转换

2022-04-07 13:38:10 1784

原创 可视化之用matplotlib.pyplot画图

matplotlib是python中最常用的画图库,当我们需要画一些复杂的图时,可以用这个库。

2022-04-07 13:23:56 979

原创 数据清洗之处理缺失值

缺失值的处理

2022-04-06 21:10:26 1039

原创 numpy之矩阵操作

Python的numpy库操作指南

2022-04-06 16:51:25 1138

原创 numpy之向量化函数

Python的numpy库操作指南

2022-04-06 16:39:52 1350

原创 numpy之通用函数

python的numpy库使用指南

2022-04-06 11:40:38 199

原创 numpy之多维数组

python的numpy库使用方法指南

2022-03-30 22:25:34 4501 1

原创 错误和异常处理

Python中的try、except、finally

2022-03-30 17:48:10 1063

原创 lambda函数

Python中的匿名函数

2022-03-30 17:19:46 374

原创 数据结构之集合

Python里的集合对象

2022-03-30 15:13:17 434

原创 数据结构之字典

Python里的字典

2022-03-29 22:25:17 916

原创 数据结构之列表

Python里的列表

2022-03-29 21:23:17 934

原创 数据结构之元组

python中的元组

2022-03-29 19:32:10 1428

原创 零碎知识——业务

文章目录1. DAU下降?2. 如何定义指标异常?3. 做完活动后,如何评估活动效果?4. 裂变营销?5. 留存低?6. 内容型平台的指标(知乎、小红书、抖音、快手等)?7. 买一送一和五折减免?8. 如何确定花呗分期的分期门槛(满**元免息)和分期数?9. RARRA模型?10. 提高留存?11. 归因分析?12. kpi是3个月完成200万单,现在过了一个月了已经完成100万单,如何判断是不是能按期完成kpi?13. 如何评价一个剧集在视频网站上的播放效果?14. 弹幕的好处:1. DAU下降?第一

2022-03-12 14:38:14 1517

原创 零碎知识——AB实验

文章目录1. AB测试流程?2. AB实验结果不显著?3. 什么情况下不能做ABtest?4. ab实验如果在同一个层要考量多个指标,p值如何定?1. AB测试流程?明确实验目的, 设计实验方案, 确定核心目标 —> 进行人群分组, 保证AA —> 收集数据 —> 分析观察2. AB实验结果不显著?样本量不满足,犯了第二类错误;整体不显著,可以进行维度拆分,看拆分后是否显著(在显著的维度(如城市)再进行一次实验,看假设是否得到验证,可能没有达到最小样本量);实验周期需要平稳,

2022-03-12 14:20:24 1482

原创 零碎知识——Python

文章目录1. range()2. 不能set([ [1, 2], [1, 2], [2, 3] ])3. float('inf') 表示正无穷,-float('inf') 表示负无穷1. range()for i in range(5, 1, -1): print(i)--> 5 4 3 22. 不能set([ [1, 2], [1, 2], [2, 3] ])3. float(‘inf’) 表示正无穷,-float(‘inf’) 表示负无穷...

2022-03-12 12:42:41 1033

原创 零碎知识——机器学习

文章目录1. SVM?2. 孤立森林?3. 过拟合?4. 连续特征离散化?5. 朴素贝叶斯?6. AUC?7. XGBoost?8. 聚类算法?9. 数据预处理?10. 线性回归和逻辑回归的区别?1. SVM?SVM的基本思想是求解能够正确划分训练数据集且几何间隔最大的分离超平面,几何间隔大意味着以充分大的确信度对训练数据进行分类。而这样的分离超平面存在且唯一。软间隔最大化就是对每个样本点引入一个松弛变量,使得函数间隔加上松弛变量大于等于1。此时目标函数加入对松弛变量的惩罚,用C来控制。C越大,对误分

2022-03-12 12:34:10 1180

原创 零碎知识——统计相关

文章目录1. 贝叶斯估计与最大后验概率估计?2. 极大似然估计?3. 协方差与相关系数?标准差与标准误?4. 怎么从很大的样本池中抽样?5. 均值和中位数?6. 辛普森悖论?7. 假设检验?8. 非参数置信区间?给定1000个样本,如何估计标准差?9. 无偏估计和相合估计?10. 泊松分布?1. 贝叶斯估计与最大后验概率估计?贝叶斯估计属于贝叶斯学派,其和频率学派最大的不同就是贝叶斯学派认为参数的真值是不固定的,是随机的,而频率学派则认为参数是固定的常数,只是未知。贝叶斯估计就是利用参数的先验概率,结

2022-03-11 18:37:59 1373

原创 零碎知识——sql相关

1. in和exists的区别2. count()3. 常用日期函数4. 常用字符串函数5. 常用计算和统计函数6. 其它函数7. 数据倾斜?8. HIVE?9. MySQL?10. 列、行互转11. Union和Union All的区别12. with rollup的用法

2022-03-11 18:01:20 5581

原创 Tableau教程——一

在数据源界面,可以连接两个表,并可以指定内/左/右连接和连接字段在数据源界面,可以通过点击字段上的 # 号更改字段的数据类型在数据源界面,可以通过 自定义拆分 将字段进行拆分,并得到一个新的字段,然后可以根据需要重命名维度是类别字段,度量是指标,是待分析的数据对于日期类数据,可以点击 + 号从年到季度再到月份,然后点击度量指标下拉键中的 快速表计算,可以计算同比右键单击图像可以给图像添加注释,复制生成图像的数据(包含计算值,像同比)右键单击工作表,然后选择 复制为交叉表,即可得到生成图像的数据.

2022-03-11 15:06:33 885

原创 非参数检验

一、定义又称为任意分布检验,不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断;仅仅依赖于数据观测值的相对大小(秩)等,通过检验样本所代表的总体分布形式是否一致来得出统计结论。推断方法和分布无关。二、优缺点2.1 优点对总体假定较少,有广泛的适用性,结果稳定性较好针对几乎所有类型的数据形态(定类、定序)容易计算2.2 缺点可能会浪费一些信息(特别当数据可以使用参数模型时)大样本手算麻烦一些表不易得到2.3 和参数检验的对比三、常用的非参数检验方法3.1 相

2022-03-11 15:05:39 1189

转载 pandas之数据透视表

交叉列表取值计算IV值数据透视表

2021-11-18 17:10:46 167

原创 pandas之分箱操作

将连续数据进行离散化常用的有两种方式:等宽法和等频法。

2021-11-18 16:36:20 4454

原创 可视化之用pandas绘制简单的图形

python中常用的绘图库除了matplotlib、seaborn之外,数据处理库pandas也能画图,本文就主要介绍如何使用pandas画图。

2021-10-05 23:03:36 13498

原创 可视化之基础设置

使用jupyter notebook + matplotlib.pyplot画图的话,需要进行一些设置

2021-10-05 20:34:22 161

原创 VLOOKUP函数

VLOOKUP(1查找的值,2查找区域,3返回值所在列,4查找精度)

2021-10-04 11:19:57 1111

原创 面试算法题

一、给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数题解class Solution: def firstMissingPositive(self, nums: List[int]) -> int: m = 1 n = len(nums) if n == 0: return m nums.sort() for i in nums: if i

2021-09-15 23:30:14 193

试验设计笔记.pdf

试验设计笔记.pdf

2021-01-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除