机器学习_07_数据特征、分布情况

最新推荐文章于 2024-04-14 23:01:55 发布

Java「在学」

最新推荐文章于 2024-04-14 23:01:55 发布

阅读量1.4k

点赞数 2

分类专栏：机器学习入门

机器学习入门专栏收录该内容

10 篇文章 0 订阅

订阅专栏

001查看前10行数据

from pandas import read_csv
#  03.采用pandas 导入数据
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.shape)
#001查看前10行数据
peek = data.head(10)
print(peek)

002.sahpe 属性查看数据维度：多少行多少列

from pandas import read_csv
#  002.sahpe 属性查看数据维度：多少行多少列
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.shape)

在这里插入图片描述
003.type 属性查看数据类型：int,float

from pandas import read_csv
#  003.type 属性查看数据类型：int,float

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.dtypes)

在这里插入图片描述
004.describe() 方法查看统计内容的描述： max,min,etc.

from pandas import read_csv
#  004.describe() 方法查看统计内容的描述： max,min,etc

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin',
	'test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.describe())

在这里插入图片描述
005.查看数据分类分布状况 groupby().class()

from pandas import read_csv
#  005.查看数据分类分布状况 groupby().class()

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.groupby('class').size())

在这里插入图片描述
006.corr()方法——计算属性相互影响的矩阵

from pandas import read_csv
from pandas import set_option
#  006.corr()方法——计算属性相互影响的矩阵
#   显示数据相关性
filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
set_option("display.width",100)
#设置数据的精度
set_option("precision",2)
print(data.corr(method='pearson'))

在这里插入图片描述
007.计算数据的正态分布偏离程度

from pandas import read_csv
#  007.计算数据的正态分布偏离程度

filename = 'Pima_Indians.csv'
names = ['preg','plas','pres','skin','test','mess','pedi','age','class']
data = read_csv(filename,names=names)
print(data.skew())

在这里插入图片描述

Java「在学」

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习_07_数据特征、分布情况

from pandas import read_csv# 03.采用pandas 导入数据filename = 'Pima_Indians.csv'names = ['preg','plas','pres','skin','test','mess','pedi','age','class']data = read_csv(filename,names=names)print(data....
复制链接

扫一扫