自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 数据分析方法02多维度拆解法

数据显示只有超一线城市有打开APP,因为公司推广时只推送了北上广深,因此用户打开几率大,所以启动事件多。背景:某公司做了一款穿搭产品的APP,前段时间在微博上进行了一波大V推广,老板想看看推广情况…数据分析团队综合分析之后,决定对推广之后的APP启动事件进行4个维度的拆解。数据显示用户主要是因PUSH下发的穿搭推送产生兴趣,而进入APP。但实际上是老用户占比下降、新用户占比上升,掩盖了用户流失。而我们的运营力量不足,只在北上广深等超一线城市进行了推送。但是因为用户打开APP的绝大部分原因,都来自推送。

2023-03-24 15:15:51 450

原创 数据分析思维01业绩下降问题

业绩下降问题分析思路

2023-03-16 16:02:27 337

原创 数据分析方法08用户画像

数据分析方法08用户画像

2023-03-09 13:34:23 1470

原创 数据分析方法01对比分析法

数据分析方法01对比分析法

2023-03-08 11:35:31 804

转载 如何搭建指标体系

如何搭建指标体系

2023-03-01 21:15:00 412

原创 列表和元组基本方法

序列:序列是一种数据结构。列表、字符串和元组都属于序列,其中列表是可变的,而元组和字符串是不可变的。要访问序列的一部分,可使用切片操作。要修改列表,可给其元素赋值,也可使用赋值语句给切片赋值。列表方法append:将一个对象附加到列表末尾。(python 没有 push 操作,用append 代替 push)clear:就地清空列表内容。copy:复制列表。count:计算制定元素在列表...

2023-02-20 20:44:15 150

原创 MySQL自学笔记

MySQL自学笔记

2023-02-20 20:41:10 207

原创 决策树(学习笔记)

算法学习算法理解决策树的本质就是从数据集中归纳出一组分类规则,也称‘树归纳’,对于给定数据集,存在许多对他无错编码的树,我们感兴趣的是从中选出最小的树(树的结点数和决策结点的复杂性度量)。(一个if-then规则的集合)从另一个角度看,决策树学习是根据训练数据集估计条件概率模型。基于特征空间划分的类的条件概率模型有无数个,我们选择的数据应该是不仅能对训练数据有很好的拟合,而且对未知数据也有...

2019-11-29 11:07:07 856

原创 KNN(学习笔记)

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei' ## 设置中文显示# plt.rcParams['font.family']='Arial Unicode MS' # mac中文显示plt.rcParams['ax...

2019-11-22 20:38:25 222

原创 特征工程之数据预处理(笔记)

特征工程:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。特征工程的目的:去除原数据中的杂项和冗余,设计更高效的特征以刻画要求解的问题和预测模型之间的关系。特征工程的重要性:**1.特征越好,灵活性越强。**好的特征的灵活性在于它允许你选择不复杂的模型,同时运行速度也更快,也更容易和维护。**2.特征越好,构建的模型越简单。**好的特征可以在参数不是最优的情况,依然...

2019-10-09 19:20:30 4075

原创 集成算法学习笔记

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E9%9B%86%E6%88%90%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb

2019-10-08 16:25:57 158

原创 聚类算法学习笔记

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/cluster%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb

2019-10-08 11:51:36 199 1

原创 二分类模型评估

分类算法最常见的指标是分类准确率(accuracy),而当样本中的分类极度不均衡时,accuracy不能说明问题(例如在100个观测样本中,有95个0,5个1,全部预测为0,accuracy是95%,已经很高了)。一般我们用混淆矩阵(Confusion matrix)来描述二分类的好坏,也通过此矩阵衍生出一系列指标。举例:ROC曲线ROC意指Receiver Operating Ch...

2019-10-03 15:09:20 1497 1

原创 python基础练习题

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/python%E5%9F%BA%E7%A1%80%E7%BB%83%E4%B9%A0%E9%A2%98.ipynb

2019-10-02 14:27:51 281

原创 项目:评分卡制作

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/Machine-Learning-Algorithms/blob/master/%E9%A1%B9%E7%9B%AE%EF%BC%9A%E8%AF%84%E5%88%86%E5%8D%A1%E5%88%B6%E4%BD%9C.ipynb

2019-09-26 16:40:56 425

原创 SVM案例:预测明天是否会下雨

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/SVM%E6%A1%88%E4%BE%8B%EF%BC%9A%E9%A2%84%E6%B5%8B%E6%98%8E%E5%A4%A9%E6%98%AF%E5%90%A6%E4%BC%9A%E4%B8%8B%E9%9B%A8.ipynb

2019-09-26 15:46:46 1234

原创 案例:泰坦尼克

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E6%A1%88%E4%BE%8B%EF%BC%9A%E6%B3%B0%E5%9D%A6%E5%B0%BC%E5%85%8B.ipynb

2019-09-26 14:43:55 139

原创 电商案例:基于聚类的个性化推荐

https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E7%94%B5%E5%95%86%E6%A1%88%E4%BE%8B%EF%BC%9A%E5%9F%BA%E4%BA%8E%E8%81%9A%E7%B1%BB%E7%9A%84%E4%B8%AA%E6%80%A7%E5%8C%96%E6%8E%A8%E8%8D%9...

2019-09-24 17:33:28 1556 1

原创 案例:基于决策树的保险业数据分析

https://github.com/CDA-zhanghuarui/-/blob/master/%E6%A1%88%E4%BE%8B%EF%BC%9A%E5%9F%BA%E4%BA%8E%E5%86%B3%E7%AD%96%E6%A0%91%E7%9A%84%E4%BF%9D%E9%99%A9%E4%B8%9A%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90.ipynb...

2019-09-20 17:53:25 2663 3

原创 SPSS学习笔记:神经网络

2019-08-15 11:41:02 2418

原创 SPSS学习笔记:逻辑回归

因变量:分类变量![![](https://img-blog.csdnimg.cn/20190814190123840.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2h1YXJ1aXlp,size_16,color_FFFFFF...

2019-08-14 20:04:50 726

转载 统计术语英汉对照表

2019-08-14 19:37:44 553

原创 SPSS学习笔记:回归模型

回归分析:要分析的因变量y必须是连续变量先看一下数据这里把绩效总分作为要预测的因变量y步骤1:画图-散点图散点图的主体模式:相关性;趋势性;异常性画出散点图后,可以添加辅助线和拟合线帮助观察变量的相关性步骤2:相关分析皮尔逊相关系数<0.05时,一般认为相关步骤3:建回归模型 β R2建立回归模型,先看方差分析表,重点关注显著性P<0.05,拒绝原假设,...

2019-08-13 20:54:18 7303

原创 SQL的查询优化

从表连接的角度优化内连接;外连接;交叉连接使用存储过程取代暂时写SQL语句从索引角度优化:对经常使用的查询字段建立索引。这样查询时只进行索引扫描,不读取数据块。1.避免在where子语句中对字段进行null判断创建数据库是限定not null,用dafault赋默认值2.避免在where子语句中使用<>或!=操作符3.避免在where子语句中使用or来连接条件如:se...

2019-08-11 14:34:55 106

原创 MySQL内置函数

数学函数abs(数值表达式)##获取一个数的绝对值floor(数值表达式)##获得小于一个数的最大整数值ceiling(数值表达式)##获得大于一个数的最小整数值round(数值表达式)##获得一个数的四舍五入的数值执行结果:sqrt(数值表达式)##函数返回一个数的平方根字符串函数ascii(字符表达式)##返回字符表达式中最左侧字符的ascii码值执行结果:char...

2019-08-10 16:02:57 101

翻译 用match和index查找数值

Index:返回给定区域中特定行列的交叉值=INDEX(给定查找区域,区域中的先对行,区域中的相对行,区域中的相对列)Match:返回特定值在数组中的相对位置=MATCH(想匹配的值,含有想匹配值的区域或数组,0or1)...

2019-07-15 21:57:30 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除