教 程 目 录
在本章中,我们将讨论如何导入数据集和库.让我们首先了解如何导入库.
导入库
让我们从导入Pandas开始,这是一个管理关系的好库(表格式)数据集. Seaborn在处理DataFrames时非常方便,DataFrames是用于数据分析的最广泛使用的数据结构.
以下命令将帮助您导入Pandas :# Pandas for managing datasets
import pandas as pd
现在,让我们导入Matplotlib库,这有助于我们自定义我们的情节.# Matplotlib for additional customization
from matplotlib import pyplot as plt
我们将使用以下命令导入Seaborn库 :# Seaborn for plotting and styling
import seaborn as sb
导入数据集
我们已导入所需的库.在本节中,我们将了解如何导入所需的数据集.
Seaborn在库中附带了一些重要的数据集.安装Seaborn后,数据集会自动下载.
您可以使用这些数据集中的任何一个来学习.借助以下函数,您可以加载所需的数据集load_dataset()
将数据导入为Pandas DataFrame
在本节中,我们将导入数据集.默认情况下,此数据集作为Pandas DataFrame加载.如果Pandas DataFrame中有任何函数,则它适用于此DataFrame.
以下代码行将帮助您导入数据集 :# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head