1.项目背景
在当今房地产市场中,准确评估住宅物业的价值对于买家、卖家以及房地产投资者而言至关重要,房产价值的准确评估不仅可以帮助买家和卖家做出明智的决策,还可以为投资者提供可靠的参考,以便在市场中抓住最佳投资机会。为了实现这一目标,本项目主要通过斯皮尔曼相关性分析、方差分析得出影响房价的显著因素,通过这些因素建立随机森林回归模型,预测精度高,最后通过输出模型的重要特征,为房产估值提供科学依据。
2.数据说明
字段 | 说明 |
---|---|
SalePrice | 房产售价(美元);目标变量。 |
MSSubClass | 建筑类别 |
MSZoning | 地区的总区域规划分类 |
LotFrontage | 与物业相连的街道线性英尺长度 |
LotArea | 土地面积(平方英尺) |
Street | 道路访问类型 |
Alley | 小巷访问类型 |
LotShape | 土地的大概形状 |
LandContour | 土地的平坦程度 |
Utilities | 可用的公用设施类型 |
LotConfig | 土地配置 |
LandSlope | 土地坡度 |
Neighborhood | 位于埃姆斯市区内的物理位置 |
Condition1 | 靠近主干道或铁路的接近程度 |
Condition2 | 第二条主干道或铁路的接近程度(如果存在的话) |
BldgType | 居住类型 |
HouseStyle | 居住样式 |
OverallQual | 总体材料和装修质量 |
OverallCond | 总体状况评级 |
YearBuilt | 原始建造日期 |
YearRemodAdd | 装修日期 |
RoofStyle | 屋顶类型 |
RoofMatl | 屋顶材料 |
Exterior1st | 房屋外层覆盖物(第一层) |
Exterior2nd | 房屋外层覆盖物(如果有第二种材料) |
MasVnrType | 砖石贴面类型 |
MasVnrArea | 砖石贴面面积(平方英尺) |
ExterQual | 外部材料质量 |
ExterCond | 外部材料当前状况 |
Foundation | 地基类型 |
BsmtQual | 地下室高度 |
BsmtCond | 地下室一般状况 |
BsmtExposure | 地下室墙壁是否有直通或花园层面 |
BsmtFinType1 | 第一种完成区域(地下室)的质量 |
BsmtFinSF1 | 类型1完成的地下室平方英尺面积 |
BsmtFinType2 | 第二种完成区域(如果存在)的质量 |
BsmtFinSF2 | 类型2完成的地下室平方英尺面积 |
BsmtUnfSF | 未完成的地下室面积(平方英尺) |
TotalBsmtSF | 地下室总面积(平方英尺) |
Heating | 加热类型 |
HeatingQC | 加热系统的质量和状况 |
CentralAir | 中央空调 |
Electrical | 电气系统 |
1stFlrSF | 首层平方英尺面积 |
2ndFlrSF | 二楼平方英尺面积 |
LowQualFinSF | 所有楼层中低质量完成的平方英尺面积 |
GrLivArea | 地面上(非地下室)的生活区域平方英尺面积 |
BsmtFullBath | 地下室全浴室数量 |
BsmtHalfBath | 地下室半浴室数量 |
FullBath | 地面上全浴室数量 |
HalfBath | 地面上半浴室数量 |
BedroomAbvGr | 地面以上(不包括地下室)的卧室数量 |
KitchenAbvGr | 厨房数量 |
KitchenQual | 厨房质量 |
TotRmsAbvGrd | 地面上(不包括浴室)的总房间数 |
Functional | 家庭功能评价 |
Fireplaces | 火炉数量 |
FireplaceQu | 火炉质量 |
GarageType | 车库位置 |
GarageYrBlt | 车库建造年份 |
GarageFinish | 车库内部装修情况 |
GarageCars | 车库容量(按车辆数计) |
GarageArea | 车库面积(平方英尺) |
GarageQual | 车库质量 |
GarageCond | 车库状况 |
PavedDrive | 水泥铺设的车道 |
WoodDeckSF | 木质露台面积(平方英尺) |
OpenPorchSF | 开放式门廊面积(平方英尺) |
EnclosedPorch | 封闭式门廊面积(平方英尺) |
3SsnPorch | 三季门廊面积(平方英尺) |
ScreenPorch | 屏蔽门廊面积(平方英尺) |
PoolArea | 游泳池面积(平方英尺) |
PoolQC | 游泳池质量 |
Fence | 围栏质量 |
MiscFeature | 其他未分类的特色 |
MiscVal | 其他特色的价值折现(美元) |
MoSold | 销售月份 |
YrSold | 销售年份 |
SaleType | 销售类型 |
SaleCondition | 销售状况 |
3.Python库导入及数据读取
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from scipy