摘要
随着后疫情时代的到来,出行游玩的需求不断增大。而在共享经济、全域旅行、旅游+的浪潮不断涌现,跨界合作的增多,市场大环境下的住宿业正面临着新的机遇和挑战。在新的时代背景和高新科技的助力下,以民宿、短租为主的非标住宿异常突起。Airbnb 作为非标住宿首秀,以互联网为依托,在不断扩大用户市场的同时,通过数据分析准确定位用户预订目标,以此掌握粘性客源。
旅行目的地预测可以帮助民宿平台系统在用户注册后未预订前为用户推荐对应目的地国家的民宿或短租服务,提高住宿业的流量吸纳能力,同时提高用户的软件使用体验。本文利用 kaggle 网站上 Airbnb 民宿的用户注册数据,通过对已注册用户的预订行为进行研究,对新用户首次预订目的地国家进行预测。通过数据预处理对数据集进行调试和修改,以图表的形式直观地体现影响用户预订目的地的变量指标。通过特征工程选择有效的特征数据,并通过适当的训练集测试集拆分,得到最终可用的数据集。通过把有效目的地做三分类处理:EU countries, Pacific countries, other,用来提高预测性能。 之后将h会运用多种模型进行测试集预测,并从单一模型和模型融合两个角度出发,对于数据预测进行处理和说明。
关键词:分类预测、模型融合、多分类问题、旅行目的地预测、Boosting算法
Abstract: With the advent of the post-epidemic era, the demand for travel and play continues to increase. With the continuous emergence of the sharing economy, global travel, and tourism+, and the increase in cross-border cooperation, the accommodation industry in the market environment is facing new opportunities and challenges. Under the background of the new era and the help of high-tech, non-standard accommodation, mainly homestays and short-term rentals, has risen sharply. Airbnb is the first show of non-standard accommodation, relying on the Internet, while continuously expanding the user market, it accurately locates the user'