检验(两样本T检验、相关分析、方差分析)(数据挖掘笔记一)

本文使用Python的statsmodels库进行统计检验,包括两样本T检验以分析不同样本的均值差异,方差分析(ANOVA)探讨分类变量与连续变量的关系,以及相关性分析来衡量变量间的关联强度。通过QQ图、直方图和散点图展示数据分布,并计算相关系数。
摘要由CSDN通过智能技术生成

# -*- coding: utf-8 -*-
"""
Created on Sat Jul 28 13:40:57 2018

@author: wangxihe
"""
#%%
import pandas as pd
import statsmodels.api as sm
import os
import numpy as np
import matplotlib.pyplot as plt
os.chdir(r'E:\spyderwork\wxh\数据科学B\样本检验')

#%%假设检验和单样本T检验
#预测房屋增长率率10%的可能性,置信区间
#增增长率不超过10%,否则要被问责
onedata=pd.read_csv('house_price_gr.csv',encoding='gbk')
onedata.describe(include='all')
onedata['duplicated']=onedata.duplicated()#判断短是否重复
(onedata['duplicated']+1).sum()==len(onedata)  #不重复为false所以每个元素+1

qq=sm.qqplot(onedata['rate'] ,fit=True, line='45')#QQ图
onedata['rate'].hist(bins=30)
onedata['rate'].plot(kind='box')
import seaborn as sns
from scipy import stats
sns.

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值