自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 Hadoop伪分布式集群搭建学习总结

hadoop伪分布式集群搭建过程学习总结

2022-07-21 15:15:20 2039

原创 《商务与经济统计》笔记第三章

《商务与经济统计》笔记第三章:描述统计学:数值方法3.1 位置的度量3.1.1 平均数、中位数、众数、3.1.2 百分位数、四分位数3.2 离散程度的度量3.2.1 极差、四分位数间距、方差、标准差、标准差系数3.3 分布形态、相对位置的度量、异常值的检测3.3.1 分布形态、Z-分数、切比雪夫定理、经验法则、异常值的检测3.4 五数概括法、箱型图3.4.1 五数概括法、箱型图3.5 两变量间关系的度量3.5.1 协方差3.5.2 相关系数第三章:描述统计学:数值方法3.1 位置的度量3.1.1

2021-11-04 17:01:42 770

原创 《商务与经济统计》笔记第四章

《商务与经济统计》笔记第四章第四章:概率4.1 随机试验、计数法则、概率分配4.1.1 计数法则、组合和排列4.1.2 概率分配4.2 事件及其概率4.3 概率的基本性质4.4 条件概率4.4.1 独立事件4.4.2 乘法公式4.5 贝叶斯定理第四章:概率4.1 随机试验、计数法则、概率分配随机试验:随机试验的试验结果是完全确定的,在许多情形下试验结果甚至在进行实验之前已经列出;在任意一次试验或者重复中,有且仅有一种可能的试验结果发生;试验中究竟哪种试验结果会出现,完全由偶然性决定。样本空间:随机试

2021-11-04 17:01:30 241

原创 《商务与经济统计》笔记第五章

《商务与经济统计》笔记第五章第五章:离散型概率分布5.1 随机变量5.2 离散型概率分布5.3 数学期望和方差5.3.1 数学期望5.4 二元分布、协方差和金融资产组合5.5 二项概率分布5.6 泊松分布5.7 超几何概率分布第五章:离散型概率分布5.1 随机变量随机变量:是对试验结果的数值描述。离散型随机变量:可以取有限多个值或者无限可数多个值的随机变量。连续型数值变量:可以去某一区间或者多个区间内任意值的随机变量一种确定随机变量是离散型还是连续型的方法,是把随机变量的值看作一条线段上的点。任

2021-11-04 17:01:18 236

原创 《商务与经济统计》笔记第六章

《商务与经济统计》笔记第六章连续型概率分布6.1 均匀概率分布6.2 正态概率分布6.2.1 正态曲线6.2.2 标准正态概率分布6.2.3 计算正态分布的概率6.3 二项概率的正态近似6.4 指数概率分布连续型概率分布重要的三种连续型概率分布:均匀分布、正态分布、指数分布离散型概率分布和连续型概率分布的根本区别在于:二者在概率计算上是不同的。对于一个离散型概率分布,概率函数f(x)给出了随机变量x取某个特定值的概率。而连续型随机变量,与概率函数对应的是概率密度函数,也记作f(x)。不同的是,概率密

2021-11-04 17:01:06 394

原创 《商务与经济统计》笔记第七章

《商务与经济统计》笔记第七章抽样和抽样分布7.1 抽样问题7.2 抽样7.2.1 从有限总体的抽样7.2.2 从无限总体的抽样7.3 点估计7.4 抽样分布简介7.5 x‾\overline xx 的抽样分布7.5.1 x‾\overline xx 的数学期望7.5.2 x‾\overline xx 的标准差7.5.3 x‾\overline xx 的抽样分布的形式7.5.4 x‾\overline xx 抽样分布的实际应用7.5.5 样本容量与 x‾\overline xx 的抽样分布的关系7

2021-11-04 17:00:38 484

原创 《商务与经济统计》笔记第八章

《商务与经济统计》笔记第八章区间估计8.1 总体均值的区间估计:σ 已知情形8.1.1 边际误差和区间估计8.1.2 应用中的建议8.2 总体均值的区间估计:σ 未知情形8.2.1 边际误差和区间估计8.2.2 应用中的建议8.2.3 区间估计方法小结8.3 样本容量的确定8.4 总体比率区间估计我们发现点估计量是用于估计总体参数的样本统计量。因为我们不可能期望点估计量能给出总体参数的精确值,所以经常在点估计上加减一个被称为边际误差的值来计算区间估计。区间估计的一般形式:点估计 +/- 边际误差在计

2021-11-04 17:00:28 645

原创 《商务与经济统计》笔记第九章

《商务与经济统计》笔记第九章

2021-11-04 17:00:07 457

原创 sklearn课堂之K-means算法的使用总结

1. 常用查询1.1 Kmeans常用参数列表常用参数含义n_clusters要划分的簇数,可不填,默认8init默认‘kmeans++’n_init使用不同的质心随机初始化的种子来运行kmeans算法的次数,默认10max_iter最大迭代次数么,默认300tol两次迭代之间inertia的变化量,如果两次迭代之间inertia下降的值小于tol设定的值,迭代就会停止precompute_distances‘auto’,True,Fals

2020-06-19 10:58:19 2414

原创 数据分析项目-某健身平台一年内的会员用户消费行为分析

数据集来源于‘和鲸社区’数据集一共包含四个属性:用户ID,购买日期,购买数量,购买金额。以秦路老师的数据分析课程的CDNow用户消费案例为参考,对该健身平台的用户进行消费特征分析。分析框架如下:1. 描述性统计从数据的描述性统计中可以看出,会员用户每次消费平均购买1.47个商品,每次平均消费22.90元。而会员用户购买数量和消费金额的均值皆略小于中位数,说明购买数量和消费金额呈右偏分布。符合消费类数据的分布状况。2. 用户消费特征分析2.1 用户整体消费分析分析:2.2 用户个人消费

2020-06-05 15:15:05 2525

原创 《谁说菜鸟不会数据分析》第五章-数据分析方法

第五章:数据分析方法主要内容:数据分析方法 / 数据分析工具一、数据分析方法数据分析作用基本方法数据分析方法现状分析对比对比分析平均分析综合评价分析…原因分析细分分组分析结构分析交叉分析杜邦分析漏斗图分析矩阵关联分析聚类分析…预测分析预测回归分析时间序列决策树神经网络…1.1 对比分析法定义:是指将两个或两个以上的数据进行比较,分析他们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。对比分析法可以非常直观的看出事物某方面的变化或差距,并且

2020-05-21 23:07:32 521

原创 《谁说菜鸟不会数据分析》第二章-数据分析方法论

第二章:结构为王-确定分析思路主要内容:数据分析方法论 / 常用的数据分析方法论数据分析方法论数据分析方法论从宏观角度指导如何进行数据分析.数据分析法则是具体的分析方法.数据分析方法论的主要作用:1.理顺分析思路,确保数据分析结构体系化。2.把问题分解成相关联的部分,并显示它们之间的关系。3.为后续的数据分析的开展指引方向。4.确保分析结果的有效性和正确性常用的数据分析方法论1. PEST分析法:political、economic、social、technological2. 5W

2020-05-21 19:59:37 196

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除