最近看到房价预测分析模型,据我自己查找是kaggle上面的入门级项目,所以觉得写一点笔记不会涉及到版权问题之类的。
其他网站上关于房价预测模型的笔记
kaggle House Prices: Advanced Regression Techniques
因为初学,对于配置之类的还不熟悉,使用的是Jupyter Notebook。
目标是房价预测,所以数据探索都以房价为中心。数据是CSV格式的,先用pandas将数据导入。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
%pylab inline
df_train = pd.read_csv('D:/datas/train.csv')
df_train.head()
df_train['SalePrice'].describe()