昨天跟队友开源了一份线上0.85的baseline,发在我们的知乎专栏里了。
知乎地址:
https://zhuanlan.zhihu.com/p/64715267
github地址:
https://github.com/leo6033/future-AI-challenge
下面贴一下baseline的主要代码部分:
def parseData(df):
"""
预处理数据
"""
df['rentType'][df['rentType']=='--'] = '未知方式'
# 转换object类型数据
columns = ['rentType', 'houseFloor', 'houseToward', 'houseDecoration', 'communityName', 'region', 'plate']
for col in columns:
df[col] = df[col].astype('category')
# 将buildYear列转换为整型数据
tmp = df['buildYear'].copy()
tmp2 = tmp[tmp!='暂无信息'].astype('int')
tmp[tmp=='暂无信息'] = tmp2.mo