拿到数据,先要了解数据:
file.head()
file.tail()
file.shape
file.columns
file.info()
频数计算:
file.col_name.value_counts(drapna=False)
#or
file[col_name].value_counts(drapna=False)
#计算特征数
file.describe()
数据可视化:
#histogram
file.col_name.plot('hist')
plt.show()
# box plot
file.boxplot(column='', by='')
plt.show()
#example
df['Existing Zoning Sqft'].plot(kind='hist', rot=70<