统计学
rungedu
计算机,算法,智能,机器学习,足球,易经,传统文化,诗词
展开
-
统计学第十七周 时间序列预测实战
统计学第十七周 时间序列预测实战一、目标:预测未来三期传统汽车的销量。二、数据背景:03年到19年第一季度分季度的数据,13年之前只有传统汽车的销量,13年之后是传统汽车+新能源汽车的销量,需要预测未来三期传统汽车的销量~ps:传统汽车的销量会受到新能源汽车的影响噢三、数据四、实战首先对各个季度的传统汽车销售量进行绘图展示,以求能够发现相应趋势。这里时间序列,能够发现一个...原创 2020-03-07 21:31:22 · 765 阅读 · 0 评论 -
统计学第十六周 时间序列分析与预测
统计学第十六周 时间序列分析与预测概念:基本概念时间序列:是同一现象在不同时间的相继观察值排列而成的序列。平稳序列:基本上不存在趋势的序列。各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,单并不存在某种规律,波动可以看成是随机的。非平稳序列:包含趋势、季节性或周期性的序列,它可能只包含其中一种成分,也可能包含几种成分,非平稳序列又分为有趋势的序列、有趋势和季节...原创 2020-02-29 22:59:45 · 3205 阅读 · 0 评论 -
统计学第十五周 方差分析实践
统计学第15周 方差分析实践题目数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:1、每个地区间的销售量是否相同?2、不同月份的销售量是否相同?3、不同时间与地区的销售量是否相同?数据问题1 每个地区间的销售量是否相同?根据上一节学习内容,可以用单因素方差分析,先假设,再构造统计量,最后进行决策根据上一节学...原创 2020-02-21 23:39:05 · 593 阅读 · 0 评论 -
统计学第十四周 : 方差分析
统计学第十四周 :方差分析一、知识点因子在方差分析中所要检验的对象称为因子或因素factor。如书中所介绍消协分析不同行业的服务质量,因此行业就可以称为因子。不同行业如零售业、旅游业、航空公司、家电制造业是行业这一因素的具体表现称为水平。每个行业下得到的被投诉次数称为观测值。由于这里只涉及行业一个因素,所以称为单因素4水平的试验。水平因素的不通表现称为水平。同时每个因子水平下得到...原创 2020-02-16 17:35:34 · 1375 阅读 · 0 评论 -
统计学第十三周 线性分析
统计学第13周-python练习线性回归研究给出数据中车辆销售与各列数据关????代码(参考自引用网站https://blog.csdn.net/qq_43315928/article/details/104150586)# -*- coding: utf-8 -*-import pandas as pdimport numpy as npfrom sklearn.model_...原创 2020-02-08 14:33:01 · 373 阅读 · 0 评论 -
统计学第十二周:回归分析
统计学第十二周:回归分析一、 概念回归分析主要解决的问题有:(1)从一组样本数据出发,确定变量之间的数学关系式(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出那些变量的影响是显著的,那些事不显著的。(3)利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。一元线性回归1.1 相关关系⚛️...原创 2020-01-17 22:42:31 · 1698 阅读 · 0 评论 -
统计学第十一周:利用假设检验分析
统计学第十一周:一 问题:1、人体体温的总体均值是否为98.6华氏度?2、人体的温度是否服从正态分布?3、人体体温中存在的异常数据是哪些?4、男女体温是否存在明显差异?5、体温与心率间的相关性(强?弱?中等?)引申出来的点:你要怎么向运营或者产品的同事展示数据结果?二 根据给出的数据进行验证(假设检验)原假设H0:给出数据,人体体温的总体均值μ0=98.6,备择假设H1:...原创 2020-01-11 21:56:27 · 557 阅读 · 0 评论 -
统计学第十周 假设检验
统计学第十周 假设检验hypothesis testing参数估计和假设检验,是统计推断的两个组成部分,他们都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对均值提出一个假设,然后利用样本信息取检验这个假设是否成立。一. 基本概念原假设统计中用一个等式或不等式表示问题的原假设。H0表示原...原创 2020-01-05 23:29:53 · 1102 阅读 · 0 评论 -
统计学第九周:参数估计python实现
统计学第九周参数估计复习参数估计,根据从总体中随机取样获得样本,根据取样样本来估计总体分布中参数的过程。方法:估计形式上分:点估计与区间估计;估计的方法有矩法估计,最小二乘法估计,似然估计,贝叶斯估计等等问题一般有:????未知参数的估计量????在一定置信度下求解估计量的精度实战2.1#coding=utf-8import pandas as pdimport nu...原创 2019-12-27 14:29:10 · 705 阅读 · 0 评论 -
统计学第八周:参数统计
统计学:参数估计概念1.利用总体统计不方便甚至是无法完成的现实状况,采用抽样的方式,利用样本提供的信息来推断总体的特征。2.点估计:point estimate, 用样本统计量的某个取值直接作为总体参数的估值。但一个点估计值的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量。当围绕点估计值构造总体参数的一个区间,这就是区间估计。3.区间估计:in...原创 2019-12-22 15:32:49 · 3521 阅读 · 0 评论 -
统计学第七周 python验证正态分布/卡方分布/T
统计学第七周一.知识回顾上周已经学习过正态分布/卡方分布/T分布等知识,前面学习已学过,但是如何选择哪一个的问题?????正态分布????卡方分布????T分布二.实践1.场景:泰坦尼克号数据,主要是age年龄,Fare价格即船票价格,Embark登船的港口,需要验证数据师傅服从正太分布,T分布,卡方分布?具体数据如下:IDAgeFareEmbarked1227.25...原创 2019-12-13 17:25:55 · 2266 阅读 · 0 评论 -
统计学第六周
统计学第六周抽样分布统计量X1,X2,...,Xn,是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,...,Xn),不依赖于任何未知参数,则称函数T(X1,X2,...,Xn)是一个统计量。X_1,X_2,...,X_n,是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X_1,X_2,...,X_n),不依赖于任何未知参数,则称函数T(X...原创 2019-12-08 22:40:51 · 301 阅读 · 0 评论 -
可视化学习第三周-对比型和分布型数据
一.目标了解数据之间的对比关系,可以通过哪些「标记+视觉通道」映射,从而来表现差异;熟练掌握表示数据对比关系的图形类型,以及这些图形的适用场景、异同;熟悉描述性统计的相关内容,掌握分布型数据可视化的常用图表和适用场景;实践:给定2个数据集,选择合适的图表并进行可视化呈现,实现工具不限;二.如何优雅地选择数据图表:对比型和分布型数据图表2.1 对比型和分布型对比型:对比两组或两组...原创 2019-12-01 22:06:20 · 663 阅读 · 0 评论 -
统计学习第5周
统计学习第5周一、概率第四周复习1、离散变量、随机变量2、期望、方差3、离散概率分布 二项分布、伯努利分布、泊松分布4、连续概率分布 均匀分布、正态分布、指数分布二、Python实现1.在安装python及进行科学计算,建议安装anaconda 3.5.0 ,版本,可以百度搜索清华大学镜像进行下载,安装,该版本对应python3.6;对于python的IDEA ,可以安装p...原创 2019-11-29 22:47:51 · 351 阅读 · 0 评论 -
统计学习第四周
统计学习第四周一、基本概念1.随机变量概念:在同一组条件下,如果每次试验可能出现的结果,并且所有结果都可以列出来,即X的所有可能值为x1,x2,x3,...,xn都能例举出来,而且X所有的可能值x1,x2,...,xn具有确定的概率P(x1),p(x2),p(x3),...,p(xn),其中P(xi)=p(X=xi),x_1,x_2,x_3,...,x_n都能例举出来,而且X所有的可...原创 2019-11-21 22:43:08 · 186 阅读 · 0 评论 -
数据可视化小组-第一周 解读数据可视化
数据可视化小组-第一周解读数据可视化对于数据可视化,还是挺有一些感触的,毕竟正在参与公司的可视化的展示。感觉小组推送的文章中4个步骤是很中肯的。> > 可视化4个过程:> >> > > > 1.确定数据可视化的主题> > > >> > > > 2.提炼可视化主题的数据> >...原创 2019-11-16 23:57:31 · 340 阅读 · 0 评论 -
统计学习第三周:描述性统计
一、python安装python安装,我们常用在windows或者linux中安装。目前经常用到的版本有python2.7,python3.6.X,不过目前python2.7在2020年将会被取消更新。网上建议升级到3.x版本,但是目前仍有些程序运行在python2.7稳定版本上,因此可能会经常安装2个版本的python。可以安装anaconda,其中自带了相关的python科学计算包...原创 2019-11-13 23:21:20 · 365 阅读 · 0 评论 -
统计学习小组第二周-数据的维度描述
数据的描述维度:数据的维度主要用集中趋势、离散程度、分布形态三块表示。一、集中趋势1.算数平均值2.加权算数平均值注:算数平均值是特殊的加权算数平均值,其每个权重均为1;同时如果数据样本中出现极大值、极小值时,再计算平均值,其实际的意义可能就会打折扣,如我们经常说的被平均了。3.几何平均值xj=x1x2⋯xnx_j=\sqrt{x_1 x_2 \cdots x_n}xj=...原创 2019-11-10 00:32:25 · 1421 阅读 · 0 评论 -
统计学学习第一周
一、统计学学习统计学课程一般的我们在分析前都会对数据质量做些简单衡量,以能够确保我们分析结果的有效性。这时我们可以用数理统计知识来衡量我们数据的质量,利用均值、方差、标准差、协方差等衡量数据的集中、离散,更甚者衡量元素之间的相关性。比如说,一年一度都会发布一项我们比较关注的数据,某某行业的平均工资,这时我们就会说:不好意思我们又拉了后腿。其实这里的平均工资,对我们这样的人来说是被平均了。如果...原创 2019-11-01 23:21:52 · 405 阅读 · 0 评论