数据分析模型
文章平均质量分 85
孟德尔的豆豆
刷题使我快乐
展开
-
Bagging tree 与 Boosting Tree
Bagging tree 与 Boosting Tree在机器学习中,我们讲了很多不同的算法。那些算法都是单打独斗的英雄。而集成学习就是将这些英雄组成团队。实现“3 个臭皮匠顶个诸葛亮”的效果。本文将介绍集成学习的 2 种主要思路:bagging、boosting。什么是集成学习?集成学习归属于机器学习,他是一种「训练思路」,并不是某种具体的方法或者算法。现实生活中,大家都知道「人多力量大」,「3 个臭皮匠顶个诸葛亮」。而集成学习的核心思路就是「人多力量大」,它并没有创造出新的算法,而是把已有的算原创 2021-09-12 17:53:29 · 973 阅读 · 1 评论 -
算法-决策树(分类算法)
决策树算法(DecisionTree)决策树是机器学习中常用的分类算法决策树顾名思义是一种树形结构,而我们的任务就是想办法构建出这样一颗树用它来进行分类。构建过程:1. 选择一个对象的特征,并根据这一训练集进行分类2.计算某特征分类结果的混乱程度(对于对混乱结果的情况评估,使用了的以下方法)信息熵:信息熵就是用来衡量一个随机变量取值的不确定性的一个指标,信息熵越大则不确定性越大,信息熵越小则不确定性也就越小。信息熵的公式:通常情况下对数以2为底或以e(自然对数)为底,并且我们规定如果p原创 2020-09-09 16:51:13 · 662 阅读 · 0 评论 -
数据分析-如何评估用户增长?
AARRR用户增长模型用于游戏,电商,网络课堂,新媒体等用户增长分析的模型1. A 获取(Acquisition)2. A 激活 (Activation)3. R 留存(Retention)4. R 收入(Revenue)5. 推荐(Referral)获取用户(Acquisition) – 用户如何找到我们 什么是渠道?一是口碑渠道,适合病毒营销; 二是有机渠道,适合搜索引擎优化、内容营销; 三是付费渠道,比如电视广告、赞助。另外,获取用户需要重点关注的指标:渠道曝光量:有多少人看到原创 2020-08-07 02:12:32 · 1133 阅读 · 1 评论