17、统计数据分析:基础与实践

统计数据分析:基础与实践

1. 统计数据分析概述

统计数据分析旨在从部分且不确定的观测中理解复杂的现实世界现象。由于数据存在不确定性,我们对现象的认知也存在不确定性,该理论的一个主要目标就是量化这种不确定性。

在进行统计数据分析时,要区分其背后的数学理论和分析后做出的决策。数学理论是严谨的,数学家构建了精确的数学框架来处理不确定性,但统计分析转化为实际人类决策的过程存在主观因素。在决策过程中,理解统计结果背后的风险和不确定性至关重要。

1.1 相关术语

在深入学习具体方法之前,我们需要了解一些术语,这些术语有助于我们从多个维度对统计技术进行分类。
- 探索、推断、决策和预测
- 探索性方法 :通过基本统计汇总和交互式可视化对数据集进行初步了解。例如使用 pandas matplotlib 探索数据集。
- 统计推断 :通过部分和不确定的观测获取关于未知过程的信息,包括估计描述该过程的数学变量的近似值。如使用最大似然法拟合概率分布、使用核密度估计非参数地估计概率分布、使用马尔可夫链蒙特卡罗方法从后验分布中采样来拟合贝叶斯模型。
- 决策理论 :从随机观测中对未知过程做出决策,并控制风险。例如使用简单的z - 检验进行统计假设检验、使用列联表和卡方检验估计两个变量之间的相关性。
- 预测 :从数据中学习,根据有限的观测预测随机过程的结果,这是机器学习的主题。 <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值