![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析与挖掘
文章平均质量分 82
statistics_man
What you see is what you get.
展开
-
在商业领域如何开展数据挖掘
在实际工作中,作为分析团队里的一名数据分析师,我们如何标准化、流程化地开展一个数据挖掘项目呢?姚志勇老师编著的《SAS编程与数据挖掘商业案例》的第13章开头部分就提供了一个比较好的可借鉴的的思路,本篇博客是本人学习过后总结的学习笔记,分享给大家,希望对大家有帮助。原创 2022-09-25 17:59:11 · 1060 阅读 · 0 评论 -
定量预测方法总结及案例实践
工作中常用的定量预测方法总结,以及相关的案例实践。原创 2022-06-20 11:45:14 · 1921 阅读 · 0 评论 -
汽车后市场询价客户数增长趋势拟合-logistics增长模型
1 背景说明正常情况下,一家公司一个业务线的客户数量的成长过程类似一个地区的人口增长一样,一般会经历这几个成长阶段,即沉默期、成长期、爆发期、稳定期,而整个过程的走势曲线符合“S”型曲线。以汽车后市场的询价客户数为例,当渗透率达到上限,以及流失和留存达到一个平衡状态之后,其客户数会维持一个稳定的水平,基于这样的一个前提假设,下面我们尝试用logistics增长模型来拟合客户数增长趋势。2 数据探索性分析用python读取数据,查看数据的信息,观察是否存在缺失的数据,计算数据的描述性统计指标,原创 2021-12-23 00:54:11 · 1691 阅读 · 0 评论 -
XGBoost参数调优—以鸢尾花数据集分类任务为例
XGBoost(Extreme Gradient Boosting)是一种集成学习算法,属于3类常用的集成方法(bagging、boosting、stacking)中的boosting算法类别。另外,XGBoost属于梯度提升决策树(gradient boosting decision tree,GBDT)模型的范畴,如果能找到模型的较为优质的参数进行训练,就可以让模型在梯度下降过程中,更快地收敛,以及更好找到更小的损失值。下面只是针对参数调优进行的实验,因此我们选择小一点的鸢尾花数据集,具体Pytho原创 2021-08-22 09:56:52 · 1013 阅读 · 0 评论 -
Excel常用统计分析函数分享
文章目录1 平均值计算1.1 无条件平均值计算:AVERAGE1.2 单一条件下的平均值计算:AVERAGEIF1.3 多条件下的平均值计算:AVERAGEIFS2 按指定条件计数2.1 条件判断介绍2.2 单字段多条件计数2.3 多字段多条件计数3 认识COUNTA与COUNTBLANK函数3.1 检查数据填写的完整性3.2 空与非空的判断4 应用SUMPRODUCT函数计算4.1 应用SUMPRODUCT函数进行多条件求和计算4.2 应用SUMPRODUCT函数进行多条件计数计算4.3 应用SUMPRO原创 2021-04-05 17:18:06 · 2874 阅读 · 0 评论 -
方差分析原理及实例应用
前言虽然网上也有很多关于方差分析的介绍,但是我还是想结合自己在学校所学的统计学专业知识以及网上的一些优秀文档做一个笔记整理,不为别的,只为以后用到这方面知识的时候有笔记可查,分享到博客也是为了和大家一起学习探究,无其他过分的想法,谢谢各位。PS:由于markdown编辑器不支持数学公式的直接复制,所以只能先在Word文档编辑好,然后以插图的形式放进来,因此在文章发现有文档的插图请不要奇怪,正常...原创 2020-04-12 13:33:17 · 17665 阅读 · 6 评论 -
零售门店营业额预测分析(时间序列建模)
一、 观察数据某公司门店营业额数据报表(虚拟数据,非真实数据)如下:可以看到表格有7个变量的数据,而且均以时间先后为顺序来记录的一组月度数据,从计量经济学的角度来分类就是一组时间序列数据,对于这类数据的预测分析,我们一般的做法是建立一个自回归移动平均模型ARMA(p,q)来预测下一期或近几期(不宜预测多期数据)的经济数据。进一步观察数据发现,这几个变量之间似乎存在某种相关(Correlat...原创 2020-02-23 00:45:33 · 7093 阅读 · 3 评论 -
成对数据T检验实例(用SPSS16.0实现)
一、 成对数据T检验原理在对两个总体均值进行比较时,有时数据是成对出现的,此时若采用两独立样本T检验所得出的结论有可能是不对的,此时应采用成对数据T检验的方法,原因如下:成对数据的差di(i=1,2,…,n)已消除数据的非处理因素之间的差别(比如在比较两个类型种子的产量时,土质是非处理因素),从而用于检验的标准差sd(计算公式不包含样本的标准差)已排除非处理因素差异的影响,只保留成对数据间的差异...原创 2020-02-21 17:55:27 · 16543 阅读 · 0 评论 -
两独立样本T检验实例(用SPSS16.0实现)
一、 两独立样本T检验原理首先我们要界定好独立样本是指两个样本之间彼此独立,没有任何的相关关系,用数理统计的语言来说就是相关系数为0。然后在菜单栏依次点击Analyze -> Compare Mean ->Independent-Samples T Test,进入Independent-Samples T Test会话框,然后将变量grade选入Test Variable...原创 2020-02-10 12:03:06 · 18577 阅读 · 1 评论 -
单一样本T检验实例(用统计软件SPSS16.0实现)
二、 单一样本T检验实例与SPSS实现过程(1) 实例分析某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著性差异,数据如表1所示:(2) SPSS16.0实现过程打开统计分析软件SPSS16.0的数据编辑器SPSS Data Editor,在变量视图(Variable View)新建两个变量,结果如图1所示:然后在数据视图中将表1的数据输入对应的变量内容区,结果如图2所...原创 2020-02-09 01:32:26 · 5513 阅读 · 0 评论 -
时间序列分析应用实例(使用Eviews软件实现)
引言某公司的苹果来货量数据是以时间先后为顺序记录的一组数据,从计量经济学的角度来分类就是一组时间序列数据。为了提高苹果来货量预测的准确度以及预测结果的可信度,下面运用Eviews软件包(即Econometrics Views 计量经济学软件包)并结合计量经济学的理论知识,选取2017年1月至2019年4月的苹果来货量月度数据(事前对原始数据进行处理,把数值单位从吨转换为万吨)为样本数据,用一个时...原创 2020-01-08 13:40:28 · 35246 阅读 · 14 评论