自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 猴子数据分析

在第1天新增的用户中,在第N天还使用过此产品的用户数,除以第1天新增的总用户数,就是留存率。产品相关的指标是指从产品的角度去衡量哪些产品好,哪些产品不好,通过找出好的产品进行推销,不好的产品去分析原因。常见的几个指标是热销产品数,好评产品数,差评产品数。转发率 = 转发某个功能的用户数 / 看到该功能的用户数,例如转发这篇文章的用户数有10万人,转发的有1万人 那么转发率 :1/10 =0.1。通过各种渠道推广来的用户,经过一段时间有的流失了,有的留存下来了,那么这群留下了的客户就是留存客户。

2024-08-20 12:51:43 778

原创 反欺诈-----

定义难度:2级类型1:提额后首次出现逾期。类型2:套现客户出现逾期类型3:某消费商户逾期率超过平均水平3倍以上类型4:某消费逾期率超过平均水平3倍以上类型5:超低额逾期类型6:异常刷卡行为,如异常MCC,高额刷卡,刷卡地异常等等,类型1:很多借款人成团,团逾期率过高类型2:首笔全额提款后首期逾期类型3:催收时发现借款人失踪,或告知非本人借款类型4:机器人语音识别1 变量的设计思路1简洁化思路:不追求错综复杂的计算逻辑,维度能降就降2可解释原则:不搞暴力衍生,追求业务可解释性。

2024-08-19 07:41:16 886

原创 分布--------

一个事件A所处的样本空间上事件A发生的概率P满足以下要求:1 非负性:P(A)>=0 发生的概率不低于02 规范性:P() =13 可见性:如果上两个事件是互斥的,那么二者发生一个的概率,P()=P()+P(假设有两个集合A=1,2,3和B=2,3,4,那么A∪B=1,2,3,4A∪B=1,2,3,4。如果某随机变量的取值个数是有限的,(如掷色子的结果)或者至多可数的(一小时内到达某窗口排队的人群),那么我们称之为离散型随机变量,其取值结果的概率称之为概率密度函数。

2024-08-13 08:40:02 335

原创 PYTHON 跟着娟姐

是指一系列按照特定顺序排列的元素组成是python中内置的可变序列在python中使用【】定义列表,元素之间用英文逗号隔开,列表中的元素可以是任意的数据类型。

2024-07-26 23:38:46 1796

原创 线性代数3

由n个数组成的有序数组。共n维,一般由表示。写成行叫做行向量,写成列就是列向量。k= 0.

2023-12-17 16:06:31 388 1

原创 线性代数2

矩阵矩阵。

2023-12-14 23:29:15 478 2

原创 线性代数1

1.1排列:由1,2,3 .....,n 组成的一个有序数组叫n级排列("..."的意思是不能缺数,1245 不是n级排列)拉普拉斯定理:再K阶子式中,任意取定K行,有K行元素组成的所有K阶子式与代数余子式乘积之和 = D (行列式的值)逆序数的定义:逆序的总数。3.1.4 行列式2行成比例,则行列式的值为 0 ,D=0 推论--> 某一行全为 0 则D =0。3.1.5 行列式的某一行为2个数之和,则可以写成2个行列式的和 和的行拆开,其他行不变。推论--> 行列式2行相等,行列式的值为0。

2023-12-13 17:28:55 1469 1

原创 卡方 z分布 F分布 T分布

适用于1配合度检验 :主要用于检验单一变量的实际观察观察分布与某理论次数是否有差别,由于他的检验内容涉及一个因素多项分类的计数资料,故可以说成是一种单因素检验。自由度:n-1fo观测数据次数fe理论次数h0: 理论等于观测:fo = fe(不独立) h1:理论观测(独立)fofe2独立性检验:2个或2个以上的因素是否有关联性独立性(性格和血型的关系)RC表,自由度:(R-1)(*C-1)fo观测数据次数fe理论数据次数。

2023-11-28 17:24:43 1135

原创 matplotlib -2 绘图属性设置

【代码】matplotlib -2 绘图属性设置。

2023-11-22 13:39:12 58 1

原创 matplotlib 画图 -1

【代码】matplotlib 画图 -1。

2023-11-21 23:59:24 55

原创 Kmeans聚类分析

X = pd.read_excel(r"C:\Users\99205\Desktop\数据集\bankdata.xlsx")第二步:重新计算三个组的中心点X.MEAN() Y.MEAN(),再重新计算每个点到三个点的距。centers = model.cluster_centers_ #获取样本聚类的中心点。第一步:随机找三个点作为中心,计算每个点到这3个中心点的距离,分成最初的三个组。labels = model.labels_#获取样本聚类后的标签。第三步:重复第二步,指导所有的点不再变化。

2023-11-14 13:09:08 41 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除