统计学
An宁
未来很近,时间很短,珍惜每一个呼吸的瞬间
展开
-
统计学与统计机器学习2--离散型数据的相关性
文章目录一、数据预处理之独热编码0、引入1、概念2、使用独热编码处理离散数据的原因3、补充4、python实现一、数据预处理之独热编码0、引入在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。可将分类值转化为数字表示,但是,即使转化为数字表示后,此类数据也不能直接用在我们的分类器中。因为,分类器往往默认数据是连续的,并且是有序的。但是,单纯的将分类值转换为数字得到的数据并不是有序的,而是随机分配的。为解决上述问题,其中一种可能的解决办法是采用独热编码1、概念独热编码:ONE-HOT E原创 2020-11-27 21:01:16 · 5440 阅读 · 1 评论 -
统计学与统计机器学习1--连续型变量相关性分析
文章目录一、简单相关性分析1、变量间的关系分析(1)函数关系(2)相关关系i、平行关系ii、依存关系iii、两者关系2、简单相关分析(1)计算两变量之间的线性相关系数i、协方差定义、柯西-施瓦尔兹不等式a、协方差定义b、柯西-施瓦尔兹不等式ii、Pearson相关系数(样本线性相关系数)iii、ρ=0,相关系数的假设检验a、引入假设检验的原因iv、t-检验的解读a、简历检验假设b、构造 t 统计量,计算相关系数 r 的 t 值c、计算 t 值和 P ,作结论3、深度探讨ρ=0一、简单相关性分析1、变量间原创 2020-11-25 21:05:26 · 8135 阅读 · 0 评论