统计
乐无异kop
这个作者很懒,什么都没留下…
展开
-
假设检验——Z检验、t检验
假设检验,也称为显著性检验,通过样本的统计量来判断与总体参数之间是否存在差异(差异是否显著)。即我们对总体参数进行一定的假设,然后通过收集到的数据,来验证我们之前作出的假设(总体参数)是否合理。在假设检验中,我们会建立两个完全对立的假设,分别为原假设H0与备择假设H1。然后根据样本信息进行分析判断,是选择接受原假设还是拒绝原假设。假设检验基于“反证法”。首先,我们假设原假设为真,如果在此基础上,...原创 2020-04-29 11:30:16 · 46224 阅读 · 2 评论 -
AQI(空气质量指数)分析与预测(二)
AQI(空气质量指数)分析与预测(一)数据分析哪些城市的空气质量较好/较差#空气质量最好的几个城市t = data['Ciyt','AQI'].sort_values('AQI') #根据AQI升序排列diaplay(t.iloc[:10]) #空气质量最好的十个城市plt.xticks(rotation=45) #X轴坐标名称倾斜45度sns.barplot(x='City', y...原创 2020-04-13 09:15:55 · 4249 阅读 · 0 评论 -
偏态分布的均值与中位数关系
如何解释均值和中位数的大小关系呢?实验室要处理敦煌莫高窟人流数据处理的任务,观察到每个洞窟的访问时间应该时遵循正偏态分布的。于是想起数据挖掘课上提到的正偏态分布中,均值大于中位数的问题。思考很久无法证明。关于正偏态,正态和负偏态的图如下。正偏也叫右偏,看起来好像是峰值在左,怎么会叫右偏呢?按维基百科的解释是:传统定义,均值大于中位数的称为右偏,也可以理解为长尾在右侧。同理可知,...转载 2020-04-11 18:13:31 · 39200 阅读 · 1 评论 -
中心极限定理——代码实现
中心极限定理-定理内容如果总体(分布不重要)均值为μ,方差为σ²,我们进行随机抽样,样本容量为n,当n增大时,样本均值逐渐趋近服从正态分布。我们可以得到如下结论:进行多次抽样,则每次抽样会得到一个均值,这些均值会围绕在总体均值左右,呈正态分布。当样本容量n足够大时,样本均值服从正态分布。· 样本均值构成的正态分布,其均值等于总体均值μ。· 样本均值构成的正态分布,其标准差等于总...原创 2020-04-03 08:03:24 · 947 阅读 · 0 评论