python 单变量数据预处理 缺失值 异常值
0.准备
In [201]:
import pandas as pd import matplotlib.pyplot as plt import matplotlib.mlab as mlab import warnings import numpy as np import seaborn as sns from sklearn.model_selection import train_test_split from sklearn import datasets from pandas.plotting import parallel_coordinates plt.rcParams['font.sans-serif'] = ['SimHei'] # 绘图时可以显示中文 plt.rcParams['axes.unicode_minus']=False # 绘图时显示负号 warnings.filterwarnings("ignore") # 不要显示警告
1. 读取数据
In [202]:
sale_data = pd.read_excel('C:\\Users\\91333\\Documents\\semester6\\data science\\第2周数据集:1-sale.xls', index_col = u'日期')
2. 粗略认识
1) 前后五行
In [203]:
sale_data.head(5)
Out[203]:
销量 | |
---|---|
日期< |