In [8]:
import pandas
from pandas import set_option
#括号里面直接指定了数据的来源,当然你也可以按照老师视频中所讲授的来操作
iris = pandas.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data')
iris.columns=['sepal_length','sepal_width','petal_length','petal_width','species']
In [4]:
print (iris.head(10))
In [6]:
print(iris.shape)
In [7]:
print(iris.dtypes)
In [9]:
set_option('display.width', 100)
# 设置数据的精确度
set_option('precision', 4)
print(iris.describe())
In [16]:
print(iris.groupby('species').size())
In [12]:
set_option('display.width', 100)
# 设置数据的精确度
set_option('precision', 2)
print(iris.corr(method='pearson')) # 皮尔逊相关系数判断相关性:1 表示变量完全正相关, 0 表示无关,-1 表示完全负相关。
In [13]:
print(iris.skew()) # skew()函数的结果,显示了数据分布的左偏或右偏。当数据接近0是,表示数据的偏差非常小。