统计学
文章平均质量分 88
学习机器学习的必备知识,记录学习历程
JNSimba
腹有诗书气自华,快叫我长胖一点吧~~~~~
展开
-
统计学~时间序列【第十一周】
概述时间序列四种变动方式:长期趋势:移动平均法(简单,加权),指数平滑法,最小二乘法季节变动:同期平均法,长期趋势剔除法循环变动,不规则变动几大模型...原创 2019-10-15 23:05:15 · 1311 阅读 · 0 评论 -
统计学~方差分析【第十周】
概述通过对数据误差来源的分析检验各总体的均值是否相等来判断分类型的自变量对数值型的因变量是否有显著影响。因素:即因子,所要检验的对象水平:又称处理,即因素的不同表现观测值:每个因子水平下得到的样本数据仅有一个因素的方差分析称为单因素方差分析,包含两个因素的方差分析称为双因素方差分析,两个以上的称为多因素方差分析。例题消费者与产品生产者、销售者或服务的提供者之间经常发生纠纷。为了对几个...原创 2019-10-06 22:25:56 · 2707 阅读 · 0 评论 -
统计学~回归分析【第九周】
文章目录一元线性回归相关关系相关关系的分类最小二乘法拟合优度检验显著性检验回归预测残差分析多元线性回归多重共线性变量选择与逐步回归参考一元线性回归相关关系相关关系是值变量的数值之间存在这依存关系,即一个变量的数值会随着另一个变量或几个变量的数值变化而呈现出一定的变化规律。例如:人的身高和体重的关系,居民收入增长率与物价指数的关系等等相关关系的分类根据相关关系的强度分类:分为完全相关,弱...原创 2019-09-24 23:38:34 · 1598 阅读 · 0 评论 -
统计学~假设检验【第八周】
概述假设检验分为假设和检验两个步骤:假设是指对事物总体的参数设立成对假设;检验是指检验设定的假设是否成立。即先提出假设,再验证假设是否合理。基本概念为了方便描述,引入硬币实验:扔100次硬币,有90次正面,10次反面。需要对硬币是否均匀做出假设。原假设硬币是均匀的备择假设备择假设与原假设一般是对立的:硬币不是均匀的显著性水平设定好原假设与备择假设之后,再检验之前,需要设定一个标...原创 2019-09-07 11:58:37 · 1887 阅读 · 0 评论 -
统计学~参数估计【第七周】
文章目录概述点估计矩估计最大似然估计区间估计总体均值的区间估计![在这里插入图片描述](https://img-blog.csdnimg.cn/20190906214755893.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3UwMTQz...原创 2019-09-06 21:56:01 · 618 阅读 · 0 评论 -
统计学~港口数据分析【第六周】
概述对上周的抽样分布理论知识进行实践。数据集: https://pan.baidu.com/s/1rvxlWe4LzlHx5td7zYGTTg 提取码: us2a数据集描述:数据包括【ID、年龄、价格、港口】问题1:按照港口分类,使用Python求出各类数据年龄和价格的统计量(方差、均值等)问题2:画出价格的分布图像,验证数据服从何种分布(卡方?正态?T分布?)问题3:按照港口分类,验...原创 2019-08-25 21:41:13 · 880 阅读 · 0 评论 -
统计学~抽样分布【第五周】
概述总体的情况常常是无法预知的,所以通常使用样本来推测总体。三种抽样方式从无限总体中抽样(总体容量N至少是样本容量n的50倍以上)从有限总体中进行有放回抽样从有限总体中进行无放回抽样抽样分布:有容量为无限或有限的总体,从中抽取一个样本容量为n的样本,并对该样本进行测量,可以获得一套样本参数(均值/方差/标准差),如果进行k次样本容量为n的抽样,会得到k套样本参数。例如:k个均值...原创 2019-08-22 08:31:32 · 2805 阅读 · 0 评论 -
统计学~体温是否符合正态分布?【第四周】
数据集数据集来源:http://jse.amstat.org/v4n2/datasets.shoemaker.html,我们取其中的体温测试是否满足正态分布。验证import pandas as pdfrom scipy import statsimport matplotlib.pyplot as pltimport matplotlib as mpl#读取数据df = pd....原创 2019-08-11 12:07:16 · 2018 阅读 · 0 评论 -
统计学~概率分布【第三周】
统计学~概率分布@(示例笔记本)[马克飞象|帮助|Markdown]随机变量随机变量是表示随机现象各种结果的变量。举例来说,掷一枚质地均匀的硬币,可能出现的结果有正面和反面。那么可以定义随机变量 X=正面/反面出现的数量X = 正面/反面出现的数量X=正面/反面出现的数量离散型随机变量如果随机变量的取值是有限的或可数无限的,称为离散型随机变量。比如:投掷硬币或这骰子,出现的结果是有限的...原创 2019-08-07 23:52:33 · 531 阅读 · 0 评论 -
统计学~描述性统计实践【第二周】
统计学~描述性统计实践(第二周)前言上周从理论的方面学习了统计学的基本知识,这周基于Python的pandas、numpy等一系列数据分析的框架利器进行实践操作。实践import numpy as np import pandas as pdfrom scipy import stats as sts#定义10个元素的随机数array = np.random.randint( ...原创 2019-07-27 17:45:47 · 293 阅读 · 0 评论 -
统计学~描述性统计【第一周】
文章目录数据的集中趋势众数中位数平均数算术平均数加权平均数几何平均数分位数数据的离中趋势数值型数据极差平均差方差标准差顺序数据分类数据异众比率相对离散程度离散系数(变异系数)分布形状偏态系数峰态系数(峰度系数)数据的集中趋势众数一组数据中,出现次数最多的数,即一组数据中占比最多的数字中位数对一组有序数据,取中间的数字,若中间数字有两个,求其均值平均数算术平均数平均数一般特指算术平均...原创 2019-07-18 18:06:24 · 675 阅读 · 0 评论