Python数据挖掘建模 chapter_4 相关性分析

最新推荐文章于 2024-03-17 21:56:10 发布

LegendGrass

最新推荐文章于 2024-03-17 21:56:10 发布

阅读量883

点赞数

分类专栏：数据挖掘文章标签： python 数据挖掘算法

本文链接：https://blog.csdn.net/lengendgrass/article/details/78456387

版权

数据挖掘专栏收录该内容

8 篇文章 1 订阅

订阅专栏

Pandas主要统计特征函数：

sum()	样本总和
mean()	样本算术平均数
var()	样本方差
std()	样本标准差
corr()	样本Spearman相关系数矩阵
cov()	样本协方差矩阵
skew()	样本偏度（三阶矩）
kurt()	样本峰度（四阶矩）
describe()	基本描述量

输入数据：

num	gps_w	gps_j	price	st
A0001	22.56614225	113.9808368	66	0
A0002	22.68620526	113.9405252	65.5	0
A0003	22.57651183	113.957198	65.5	1
A0004	22.56484081	114.2445711	75	0
A0005	22.55888775	113.9507227	65.5	0
A0006	22.55899906	114.2413174	75	0
A0007	22.54900371	113.9722597	65.5	1
A0008	22.56277351	113.9565735	65.5	0
A0009	22.50001192	113.8956606	66	0

（详细为2017全国大学生数学建模大赛 B题数据）

#-*- coding: utf-8 -*-
from __future__ import print_function
import pandas as pd

catering_sale = 'pdata.xls' #含有其他属性

outputfile = 'data_result.xls' #保存结果的文件名
data = pd.read_excel(catering_sale, index_col = 'num') #读取数据，指定num列为索引列

a=data.corr() #相关系数矩阵
b=data.corr()['price'] #只显示price相关系数
#c=data[u''].corr(data[u'']) #计算相关系数

a.to_excel(outputfile) 
print(a)

输出

	gps_w	gps_j	price	st
gps_w	1	-0.614413664	0.120464302	0.195195069
gps_j	-0.614413664	1	-0.059688653	-0.074869944
price	0.120464302	-0.059688653	1	0.203055567
st	0.195195069	-0.074869944	0.203055567	1

LegendGrass

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Python数据挖掘建模 chapter_4 相关性分析

Pandas主要统计特征函数：sum()样本总和mean()样本算术平均数var()样本方差std()样本标准差corr()样本Spearman相关系数矩阵cov()样本协方差矩阵skew()样本偏度（三阶矩）kurt()样本峰度（四阶矩）descri
复制链接

扫一扫

专栏目录