- 博客(7)
- 收藏
- 关注
原创 主题模型学习笔记1 认识gamma函数、二项分布、多项分布、beta函数、狄利克雷分布
1.Gamma函数2.二项分布3.多项分布4.Beta分布5.狄利克雷分布狄利克雷分布是Beta分布的推广,beta分布是狄利克雷的特例
2018-04-26 19:40:30 605
原创 xgboost原理推导和python实现
本文通过学习陈天奇博士的slides和一些官方文档梳理了xgboost原理和推导过程,仅仅是初步梳理,还有很多问题需要进一步研究,整体感觉Xgboost很强大,集合了CART、boosting、bagging的优点,包括树的剪枝、行采样、列采用、正则化项等二.Xgboost基本原理英文:http://xgboost.readthedocs.io/en/latest中文:...
2018-04-26 15:01:43 11204 6
原创 Windows+Xgboost+Anaconda环境搭建
介绍: Xgboost ( eXtreme Gradient Boosting )是陈天奇博士开发的一个基于GBDT的机器学习算法,此算法适用于分类和回归,优点:速度快、效果好、能处理大规模数据、支持多种语言、支 持自定义损失函数等等。 缺点:发布时间短(2014),工业领域应用较少,待检验;安装步骤:1.在Anaconda中直接输入pip install xgboost:会出...
2018-04-24 11:47:07 322 1
原创 数据分析—用excel2016和python画箱线图
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。一.用excel画箱线图Excel2016版可以直接画箱线图:插入-->箱线图(but:2016不能调分两类间距,体检不...
2018-04-23 18:46:57 10059
原创 数据分析—用户行为分析
电商网站用户购物路径如下: 用户行为分析定义:对用户购物路径日志信息进行统计、分析,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。 用户行为分析目的:通过对用户行为监测获得的数据进行分析,可以让企业更加详细、清楚地了解用户的行为习惯,从而找出网...
2018-04-17 19:57:58 23136 1
原创 数据分析—RFM模型
信息时代的来临使得企业营销的焦点从产品中心转化为客户中心,客户关系关系成为企业的核心问题,客户关系管理的核心问题是客户分类,通过客户分类区分无价值、高价值客户,针对不同价值的客户采取不同的营销策略,以实现企业利润的最大化; RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行...
2018-04-16 23:35:51 15453
原创 数据分析----BCG模型(波士顿矩阵分析)
参考百度百科 波士顿矩阵(BCG Matrix) 又称市场增长率—相对市场份额矩阵、四象限分析法、产品系列结构管理法等,是一种规划企业产品组合的方法。问题的关键在于要解决如何使企业的产品品种及其结构适合市场需求的变化,只有这样企业的生产才有意义。 波士顿矩阵是由BCG提出的,这个模型主要用来协助企业进行业务组合或投资组合。在矩阵坐标轴是的两个变量分别是业务单元所...
2018-04-15 18:41:47 35255
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人