自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 方差分析

数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:1、每个地区间的销售量是否相同?2、不同月份的销售量是否相同?3、不同时间与地区的销售量是否相同?数据如下:方差分析最方便自然是使用Exce了。使用Excel中的数据分析,双因素方差分来进行:输出结果如下:在查看其结果之前,复习一下方差分析的基本假设:按照α = 0....

2020-02-23 23:10:12 199

原创 python回归分析

import numpyfrom pandas import read_csvfrom matplotlib import pyplot as pltfrom sklearn.linear_model import LinearRegressiondata = read_csv(‘file:///Users/apple/Desktop/jacky_1.csv’,encoding=‘GBK...

2020-02-14 00:04:09 252

原创 线性回归

1.回归的意义及用处:回归时研究因变量对自变量的依赖关系的一种统计分析方法,目的是通过自变量的给定值来估计或预测因变量的均值。它可用于预测、时间序列建模以及发现各种变量之间的因果关系。指示自变量和因变量之间的显著关系;指示多个自变量对一个因变量的影响强度。用处:回归分析可以用于比较那些通过不同计量测得的变量之间的相互影响,如价格变动与促销活动数量之间的联系。这些益处有利于市场研究人员,数据...

2020-02-03 19:40:53 3291

原创 假设检验实践 python代码练习

1、获取数据import pandas as pdpath = ‘F:/BaiduNetdiskDownload/test.csv’data = pd.read_csv(path)print(data.head())2查看整体的人体体温均值print(data.mean())人体均值为98.249华氏度,人体心率均值为 73.763查看人体的温度是否服从正态分布from ...

2020-01-12 16:08:13 221

原创 假设检验

基本概念:原假设,准备择假设,两类错误,显着性水平,p值(容易糊涂),单侧检验,双侧检验假设检验的分类:参数的检验分为一个总体参数和两个总体参数的检验一个总体参数的假设检验:总体均值的检验,总体比例的检验,总体方差的检验两个总体参数的假设检验:两个总体均值之差的检验,两个总体比例之差的检验,两一个总体方差比的检验假设对总体参数的具体数值估算的陈述备择假设通常指研究者想收集证据初步支持...

2020-01-05 23:39:28 368

原创 参数估计

参数估计参数估计是指用样本统计量去评估总体的参数, 通过对样本的分析结果来对总体进行一个评估• 估计量. 在参数估计中, 用来估计总体参数的统计量成为 估计量 (例如 样本均值, 样本比例, 样本方差)• 估计值. 根据一个具体的样本计算出来的估计量的数值成为 估计值 .参数估计的方法分为 点估计 和 区间估计 两种.点估计:点估计即用样本统计量的某个取值直接作为总体参数的估计值.矩...

2019-12-22 23:35:47 230

原创 使用Python实现抽样分布的正态分布、卡方分布、T分布

import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltpath = ‘C:/Users/统计学学习/data.xlsx’data = pd.read_excel(path)embark = data.groupby([‘Embarked’])embark_basic = data.groupby...

2019-12-15 23:56:27 1871

原创 抽样分布

中心极限定理1、当碰到需要为样本计算概率的问题时,不需要计算样本比例的概率,而需计算样本平均值的概率。要计算样本平均值的概率,则先要得出样本均值的概率分布,才能用该分布求出概率。2、中心极限定理定义:如果从一个非正太总体X中取出一个样本,且样本很大,则样本的均值近似为正态分布。中心极限定理特征:1)样本平均值约等于总体平均值。2)不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体...

2019-12-08 23:58:12 567

翻译 概率分布实践

一、概率分布简介概率分布包括离散概率分布和连续概率分布。离散数据:数据由一个个单独的数值组成,其中的每一个数值都有相应概率。连续数据:数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件的结果。离散概率分布包括:伯努利分布、二项分布、几何分布、泊松分布连续概率分布包括:正态分布、幂律分布二、python安装scipy包三、概率分布实现1.离散概率分布:伯努利分布2...

2019-12-01 23:33:32 97

原创 概率与概率分布

概率与概率分布一、试验、事件和样本空间1、对一个或多个对象进行一次观察或测量的过程,称为一次试验 特点:在相同条件下重复进行 试验结果可能不止一个 不能确定试验的确切结果2、试验的结果称为事件3、不能被分解成其他事件组合的基本事件,称为简单事件4、在一定条件下,一定发生的事件称为必然事件5、一项试验中所有可能结果的集合,称为样本空间6、样本空间中每一个特定的试验结果,称为样本点...

2019-11-24 23:53:30 244

原创 描述性统计

描述性统计1、取数path = “D:\数据分析(统计学)资料\实践一.csv”data = pd.read_csv(path, encoding = “UTF-8”).iloc[0:20,1]iloc:df.loc[0:3, [‘a’, ‘b’]]#取出0,1,2,3行的a,b两列,#如果只取一列那么就这样写df.loc[0:3, ‘a’]#如果取多列,那么要把列用[]放在一起如df...

2019-11-17 23:47:59 204

原创 描述性统计

1、集中趋势度量众数:一组数据中出现最多的变量值中位数:一组数据排序后处于中间位置上的变量值 分位数:四分位数、十分位数、百分位数平均数:一组数据相加后除以数据个数的结果值 各变量值倒数的平均倒数,称为调和平均数n个变量值乘积的n次方根,称为几何平均数众数是一组数据分布的峰值,是一种位置代表值,不受值极端的影响中位数是一组数据中间位置上的代表制,适合于作为数据顺序数据...

2019-11-10 23:13:11 226

原创 统计学课程学习【理论】数据的图标展示

数据预处理3.11、数据审核:我们把数据源做好,一定要去系统上拉点数据,跟自己的数据源做比较,数据务必要对的准,才能真正反正出业务问题2、数据筛选和排序:书本上的Excel的处理是非常基础,我觉得数据得筛选,更重要的是数据间对比的参照物的选定,两个数据的对比,一定要做到其他关系是一样的,才具有可比性。另外排序是最基本的,我一般用的倒序比较多,就是降序,能简单易了看到最好到最坏的排序。3、数...

2019-11-03 01:27:40 400

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除