01
Seaborn自带数据集
在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供的函数load_dataset("数据集名称")来获取线上相应的数据,返回给我们的是一个pandas的DataFrame对象。
import seaborn as sns
df = sns.load_dataset('titanic')
df.sample(5)
返回的DataFrame对象非常便于我们更加深入地了解数据,示例代码:
df = sns.load_dataset("tips")
print("
[数据集基本信息]
")
print(df.info())
print("
[数值变量信息]
")
print(df.describe())
print("
[离散变量信息]
")
for name in df.dtypes[(df.dtypes == "category") | (df.dtypes == "object")].index:
print("{} 特征值 :