自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 pycharm2020版 : error: failed to send plot to http: //127.0.0.1:63342

在window x7,按装了pycharm2020版后,程序跑到画图部分,图片显示不出来,而且报出以下错误:error: failed to send plot to http: //127.0.0.1:63342...(省略中间报错信息)urllib.error.HTTPError:HTTP Error 503: Service Unavailable经过网上搜索,需要关闭本地代理。于是自己尝试了以下方法:(window x7)解决方法是:点击电脑Internet属性->连接-&gt

2020-09-18 18:23:22 1921 1

原创 python 单斜杠/和双斜杆//的区别

python 单斜杠/和双斜杆//的区别:不管是单斜杆还是双斜杆,都是属于除法运算符;单斜杠是我们最常见的除法计算符号;1、它们最大的区别是返回的结果不一样,单斜杠计算的结果是保留若干小数;而双斜杆的结果是保留最小整数(类似于向下取);2、A//B的返回类型取决与A和B的数据类型,只有A和B都为int型时结果才是int(此时表示两数正除取商);例子展示:单斜杆用法1.A和B都为int型,结果为float型 11/9 => 1.22222222222232.A为int型和...

2020-08-24 20:47:09 4329

原创 python 实现时间序列(趋势型序列预测)

本篇文章主要是通过例子使用python语言实现时间序列中趋势型序列的预测,分别是线性趋势和非线性趋势预测。

2020-03-08 11:45:36 6449

原创 时间序列分析和预测

本篇主要从两方面去介绍传统的时间序列分析方法,一是时间序列数据的统计描述,二是其预测方法。

2020-03-01 16:08:56 2444

原创 sas 分析分类数据(1)

本篇主要通过案例分析, 了解和掌握sas的一些基础知识。基础知识点有: 目录 创建sas数据集 了解proc mean & proc freq 过程步 给变量添标签 给变量值添加标签 重编码数据 用输出格式重编码变量 创建sas数据集data quest; input ID $ 1-3 AGE ...

2020-02-15 22:59:47 2212

原创 方差分析

本篇主要是简单描述方差分析的基本原理和计算公式,计算公式已附上。

2020-02-08 18:16:53 5933

原创 python 实现可重复双因素方差分析(3)

本篇主要是用python实现可重复双因素方差分析,并用案例解析。代码可以直接调用。

2020-02-08 17:21:05 3114 1

原创 python 实现无重复双因素方差分析(2)

本篇主要是用python实现无重复双因素方差分析,并用案例解析。代码可以直接调用。

2020-02-08 17:20:43 1784 1

原创 python 实现单因素方差分析(1)

案例:分析行业对被投诉次数是否有显著影响()提出假设:由于变量行业有4个水平,分别是零售业、旅游业、航空公司和家电制造业,那么为了检验这4个水平(每个水平代表一个总体)的均值是否相等,需要提出如下的假设: 行业对被投诉次数没有显著影响不完全相等 行业对被投诉次数有显著影响# 导入相关包import pandas as pdimport numpy ...

2020-02-08 17:19:19 4764 1

原创 回归分析-常用统计量含义解析

线性回归模型预测好坏,评判标准主要观察回归直线与各观测点的接近程度(即直线的拟合优度)。但是如何量化它们之间的接近程度呢?可使用以下常用统计量进行衡量。各统计量分解如下:SST总平方和 SSR回归平方和 SSE残差平方和 回归平方和是回归值与均值的离差平方和,可以看做由于自变量的变化引起的的变化(即受的影...

2020-02-04 15:31:56 19531

原创 多元线性回归--案例分析及python实践

本篇主要是针对回归分析过程中所使用到的统计量进行汇总,并通过案例,结合python语言实现。适用于一元线性回归和多元线性回归。代码可直接使用。

2020-02-03 18:06:55 6482 1

原创 python 实现相关系数计算和检验

一般情况下,总体相关系数是未知的,通常将样本相关系数r作为的近似估值。案例如下:检验不良贷款与贷款余额之间的相关关系是否显著(=0.05).假设:import pandas as pdimport numpy as npimport scipyimport matplotlib.pyplot as pltfrom pylab import mplmpl.rcPar...

2020-01-29 16:26:25 11831 1

原创 相关分析和回归分析

数值型自变量和数值型因变量之间关系的分析方法--相关与回归分析相关与回归是处理变量之间关系的一种统计方法。(1)从所处理的变量多少来看若研究的是两个变量之前的关系,则称为简单相关与简单回归分析;若研究的是两个以上变量之间的关系,则称为多元相关与多元回归;(2)从变量之间的关系形态来看,有线性相关与线性回归分析;非线性相关与非线性回归分析;统计分析的目的在于根据统计数...

2020-01-29 16:23:09 4288

原创 分类数据分析

卡方检验的应用主要表现在两个方面:拟合优度检验和独立性检验。列联表是进行独立性检验的重要工具。统计数据的类型分别有:分类数据、顺序数据、数值型数据。分类数据是对事物进行分类的结果,其特征是,调查结果虽然用数值表示,但不同数值描述调查对象的不同特征。注意:分类数据的结果是频数,卡方检验是对分类数据的频数进行分析的统计方法。卡方统计量应用卡方统计量可以用于测定两个分类变量之间的...

2020-01-19 19:41:12 4015

原创 python 实现假设检验

(1)两个总体均值之差检验以下为样本量小,两个总体方差未知,同时两个总体方差不相等,因此采用T分布,其自由度为fimport numpy as npimport pandas as pdfrom scipy.stats import timport scipy x1 = [568, 681, 636, 607, 555 ,496, 540, 539, 529,...

2020-01-12 21:20:42 1212

原创 假设检验

(1)参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。 而在假设检验中,则是先对总体参数μ的值提出一个假设,然后利用样本信息去检索这个假设是否成立。(2)原假设和备择假设的关系?原假设H0(又称“零假设”) &备择假设H1(又称“替换假设”) 原假设...

2019-12-28 11:53:14 947 1

原创 python 实现参数估计--置信区间

(1)py实现一个总体均值的置信区间def mean_interval(mean=None, std=None, sig=None, n=None, confidence=0.95): """ mean:样本均值 std:样本标准差 sig: 总体方差 n: 样本量 confidence:置信水平 功能:构建总体均值的置信区间...

2019-12-25 23:34:49 9560

原创 参数估计

参数估计(parameter estimation):用样本统计量去估计总体的参数。【用样本估计量θ̂作为总体参数θ】估计量:在参数估计中,用来估计总体参数的统计量称为估计量(estimator)。 如样本均值、样本比例、样本方差等都可以是一个统计量。估计值:根据一个具体的样本计算出来的估计量的数值称为估计值(estimated value)。点估计:用...

2019-12-22 10:31:57 730

原创 python 实现抽样分布(T分布、F分布、卡方分布)

标准正态分布T分布F分布卡方分布

2019-12-14 16:18:15 8522 1

原创 统计量&抽样分布

(1) 常用统计量样本均值 样本标准差 样本方差 样本偏度 样本峰度(2) 分布统计推断三大中心内容:抽样分布、参数估计、假设检验统计三大分布:在正态总体条件下,X平方(X^2)分布【Chi-square distribution】--赫尔默特和皮尔逊分别推导出卡方检验的基本思想就是根据样本数据推断总体的频次与期望频次是否有显著性差异。定义条件假设随机变量 ...

2019-12-07 14:58:45 364 1

原创 python 实现统计分布

泊松分布(poission distribution)公式:式中,λ为给定时间间隔内事件的平均数。python 绘制泊松分布图==================================================================================正态分布()公式:图示:python 绘制正态分布图...

2019-12-01 12:21:11 2343

原创 概率分布

随机事件:在同组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件。必然事件:在同一组条件下,每次试验一定出现事件。不可能事件:在同一组条件,每次试验一定不出现的事件。随机变量:有一个或一个以上的可能值。随机变量分为两类:离散型随机变量 、连续型随机变量...

2019-11-24 23:18:42 123

原创 Python 实现基础统计量

1.导入相关库2.测试数据点3.统计量python库函数实现4.统计量 python 自定义函数实现# 众数# 平均值# 中位数# 方差# 标准差# 标准化# 偏度# 峰度...

2019-11-16 18:29:16 643

原创 描述统计

基本统计数据概念统计数据基本分为3大类,分别如下分类数据(categorical data) 顺序数据(rank data) 数值型数据(metric data)分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述的。顺序数据:是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。数值型数据:是按数字尺度...

2019-11-10 12:54:14 721

原创 数据的图表展示

1、数据预处理:数据审核、筛选、排序在做数据处理时,有以下几个步骤需要遵循的:查看数据量大小;查看数据类型,每种数据类型量有多少,比如数值型、类别型等查看数据行列缺失情况,缺失值量有多少,是否剔除记录、剔除列,或者是否有满足填充值条件在对数据进行描述统计时,数据排序,各个取值占比情况,都需要了解清楚。2、品质数据的整理与展示:分类数据的整理与展示、顺序数据的整理与展示...

2019-11-02 11:27:53 418

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除