- 博客(4)
- 收藏
- 关注
原创 SVM_信用卡欺诈
信用卡欺诈问题概述实现过程SVM介绍数据源下载代码实现代码解释总结概述初衷是因为引用卡欺诈问题相对与其他机器学习问题略有不同,因为二分类数据量差距过大,导致以往的评价方法对其不适用,如下图的284807 笔交易中只有492笔是欺诈行为,如果用以为的准确率评价几乎都在99%以上,但是这并不能说明模型好,因为即使漏掉1个欺诈交易都是损失很大的,所以这篇里引入了召回率和精确率,进行综合评价,详细步骤...
2020-04-20 00:11:20 2297
原创 数据分析_算法_决策树
概述决策树是数据挖掘经典算法,既可以做分类,又可以做回归。下面介绍决策树的基本概念和相关术语,算法方面讲解ID3、C4.5、CART算法,并阐述各自的特点及其使用场景,最后用典型案例“泰坦尼克生存”作为实战,过程中会介绍模型评价机制和相关方法。基本概念一个完整的决策树会经历:构造、剪枝两个过程。构造构造的过程就是选择什么属性作为节点的过程,那么在构造过程中,会存在三种节点:根节点、节点...
2020-04-14 18:21:44 724
原创 数据分析_Python作图
Python作图概述选图_根据目的作图前 _根据数据关系常用图介绍及代码实现散点图折线图直方图条形图箱线图饼图热力图蜘蛛图二元变量分布成对关系总结:概述工作时有时候有些数据在用Python处理完直接作图比较方便。下面叙述一下日常作图的步骤和常用的图表实现方式。玫瑰图等比较帅的图的做法后续补上。可视化要是做的好还是挺能吸人眼球的,而且python也能实现比发杂的作图。选图_根据目的画图第一步...
2020-04-13 15:50:52 5324
原创 数据分析_用户画像即标签化
用户画像:标签化就是数据抽象能力用户画像准则概述统一用户标识给用户打标签业务化按数据流处理的阶段划分用户画像建模的过程以美团为例给用户打标签业务化用户画像准则概述现实中,BOSS很容易提出一个问题,让你用数据分析的方法,为我们的用户分类,减少流失提高销售额等。这种时候可以这么和老板说,这个工程有3个步骤:第一步,统一用户标识,也就是用户ID,方便全程跟踪。对应在数据层标识这些用户的“事实...
2020-04-11 20:18:42 920
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人