![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计学习
shiinerise
程序媛 ~ sunshine ~ 有强迫症 =.=
展开
-
python时序分析实战
本周是时序分析实战~目标是预测未来三期传统汽车的销量。数据背景:03年到19年每一季度分季度的数据,13年之前只有传统汽车的销量,13年之后是传统汽车+新能源汽车的销量,需要预测未来三期传统汽车的销量~ps:传统汽车的销量会受到新能源汽车的影响噢~链接:https://pan.baidu.com/s/1mvbBtA6MybvBj6PTE1kNbA提取码:916timport pand...原创 2020-03-08 10:50:33 · 540 阅读 · 1 评论 -
时间序列相关知识
本篇目录1 基本概念2 平稳序列的预测3 趋势性序列的预测1 基本概念时间序列(times series):同一现象在不同时间上的相继观察值排列而成的序列。平稳序列(stationary series):基本上不存在趋势的序列非平稳序列(non-stationary series):包含趋势、季节性和周期性的序列,可能只含其中一种成分,也可能是其中几种成分的组合趋势(trend):时...原创 2020-03-08 10:05:15 · 978 阅读 · 0 评论 -
python方差分析实战
本篇目录单因素方差分析的步骤双因素方差分析步骤1、每个地区间的销售量是否相同?2、不同月份的销售量是否相同?3、不同时间与地区的销售量是否相同?数据背景:有A、B、C、D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试解决:1、每个地区间的销售量是否相同?2、不同月份的销售量是否相同?3、不同时间与地区的销售量是否相同?用到的数据:链接:https://pan...原创 2020-03-01 22:12:32 · 1380 阅读 · 1 评论 -
python回归分析实战——汽车销量与什么因素有关
用到的数据:汽车销售数据:https://pan.baidu.com/s/1VlTy4nfvgXdDzgimVguZMg1 分析数据1.1 导包,读取数据import pandas as pdimport numpy as npfrom sklearn.linear_model import LinearRegression from sklearn.model_selection ...原创 2020-02-16 20:44:44 · 4176 阅读 · 1 评论 -
python假设检验实战,是否服从正态分布,异常数据,相关性
假设检验实战1.要解决的问题给出的数据集为人体的体温数据,下载链接为 https://pan.baidu.com/s/1t4SKF6U2yyjT365FaE692A*包括三个数据字段:gender:性别,1为男性,2为女性Temperature:体温HeartRate:心率要解决的问题如下:人体体温的总体均值是否为98.6华氏度?人体的温度是否服从正态分布?人体体温中存在...原创 2020-01-19 20:58:03 · 6523 阅读 · 0 评论 -
python实现区间估计,一个正态总体,均值已知,未知的区间估计,正态分布,t 分布
首先导入数据,这里使用的是一次数据竞赛的 train_label 的数据,即房租的价格import pandas as pdimport numpy as npfrom scipy import statsdata = pd.read_csv('train_data.csv')tradeMoney = data['tradeMoney']tradeMoney_mean = np.me...原创 2020-01-13 17:32:12 · 2726 阅读 · 2 评论 -
python 抽样分布实践
本次选取泰坦尼克号的数据,利用python进行抽样分布描述,主要是提供实现代码,具体的理论知识不会过多涉及。(注:是否服从T分布不是进行t检验~)字段说明:Age:年龄,指登船者的年龄。Fare:价格,指船票价格。Embark:登船的港口。需要验证的是:1、验证数据是否服从正态分布?2、验证数据是否服从T分布?3、验证数据是否服从卡方分布?我们选取年龄作为栗子进行数据验证。i...转载 2019-12-15 19:45:34 · 311 阅读 · 0 评论 -
统计学习四:概率分布
本周的统计学学习小组的学习内容是【概率分布】,主要包括以下三个知识点:基本概念:随机变量、古典概率、条件概率、离散变量、连续变量、期望值、【大数定律】;离散变量概率分布:二项分布、伯努利分布、泊松分布 ;分布的形状:均匀分布、正态分布、指数分布;总结如下:由于本周的内容以前以学过,现总结手写如下:...原创 2019-11-21 16:27:15 · 241 阅读 · 0 评论 -
统计学习三:数据的描述性统计实践
上周学习了数据的描述性统计,总结如下:下面以我画的两张表格来比较下各特征值的异同:中位数众数算数平均数几何平均数英文名MedianModeArithmetic meanGeometric Mean别称中值均值定义一组数据排序后处于中间位置上的变量值一组数据中出现次数最多的变量值n个变量的和除以nn个变量值连乘积的n次方根优点...原创 2019-11-13 16:37:26 · 760 阅读 · 0 评论 -
统计学习二:数据的描述性统计
参加此统计学习小组主要是巩固 python 语言,故所有笔记都以 python 代码实现。完整代码见 github : StatisticLearning如何描述数据的分布?可以从以下三个方面来描述:集中趋势离散程度分布的形状一、集中趋势集中趋势反映了各数据向其中心值靠拢或聚集的程度。本示例为给出的 .xlsx 文件中的表格数据,数据为 9 个家庭的人均月收入数据(单位:元)...原创 2019-11-10 19:47:57 · 2672 阅读 · 0 评论 -
统计学习一:数据的图表展示
统计学习一:数据的图表展示参加此统计学习小组主要是巩固python语言,故所有笔记都以python代码实现一、数据预处理1.数据审核、筛选、排序表一:姓名统计学成绩数学成绩英语成绩经济学成绩张松69688486王翔91759594田雨54886778李华81608664赵颖75968183宋..原创 2019-10-31 14:57:50 · 1809 阅读 · 0 评论