数据理解啊

一根小羽毛

于 2021-11-03 08:53:51 发布

阅读量125

点赞数 1

分类专栏：机器学习文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/weixin_43912853/article/details/121113734

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

from pandas import read_csv
from pandas import set_option
filename = 'pima.csv'
#这里为数据补充了文件头
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(filename, names=names)
#查看数据的维度
print(data.shape)
#查看数据的前10行
print(data.head(10))
#查看每一个字段的数据类型
print(data.dtypes)
#描述性统计，设置数据的精确度
#横向最多显示多少字符
set_option('display.width', 100)
set_option('precision', 4)
print(data.describe())
#数据分布统计（分类算法常用）
print(data.groupby('class').size())
#数据属性的相关性，0表示无关，1表示完全正相关，-1表示完全负相关，
# 当相关性较高时，考虑对特征进行降维处理
print(data.corr(method = 'pearson'))
#数据的分布分析,用skew方法来计算所有数据属性的高斯分布偏离情况，
# 数据接近0时，表示偏离较小
print(data.skew())

在这里插入图片描述

一根小羽毛

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
数据理解啊

from pandas import read_csvfrom pandas import set_optionfilename = 'pima.csv'#这里为数据补充了文件头names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']data = read_csv(filename, names=names)#查看数据的维度print(data.shape)#查看数据的前10行print
复制链接

扫一扫

专栏目录