python3常用的数据清洗方法(小结)
发布时间:2020-08-22 21:00:48
来源:脚本之家
阅读:72
作者:竹子莱西
首先载入各种包:
import pandas as pd
import numpy as np
from collections import Counter
from sklearn import preprocessing
from matplotlib import pyplot as plt
%matplotlib inline
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体设置-黑体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
sns.set(font='SimHei') # 解决Seaborn中文显示问题
读入数据:这里数据是编造的
data=pd.read_excel('dummy.xlsx')
本案例的真实数据是这样的:
对数据进行多方位的查看:
实际情况中可能会有很