Intro
- 本文用于整理数据预处理过程中的常见基础代码,不讲解背景知识。
导入常用库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import importlib
import sklearn as sk
from importlib import reload
# 若是在mac OS 下使用Jupyter notebook or jupyter lab
# 这样可以使用高清视图呈现数据可视化结果
%matplotlib inline
%config InlineBackend.figure_format = 'retina'
加载数据集
- sklearn自带数据集加载,用于自行练习
# 数据集加载:sklearn自带数据集
# load_* 同样的方式可以加载其它学多小体积的数据集
from sklearn.datasets import load_iris
iris_data = load_iris()
# 数据集的描述信息
print(iris_data.DESCR