方染-CSDN博客

原创生活日常——Python课程作业

文章目录背景一、数据预处理1、空值2、独热编码二、绘图三、数据模型选取及拟合两步模型两步模型——第一个模型（仅判断是否有工作）两步模型——第二个模型（仅估计工资高低）两步模型——总结一步模型总结背景 Python课期末考核之一是个人课程大作业，老师只有以下要求： 1、从Kaggle上找一个数据集并进行分析； 2、必须使用Python。这个大作业的自由度很高，选题内容很宽泛。我选择一个关于工资预测的数据集，共14个变量215个数据点。一、数据预处理我选取Kaggle数据库中的Placeme

2021-08-11 15:54:37 482

原创变量选择（基于边际贡献最大准则）

变量选择（仅一种方法——边际贡献最大）可行路线及分析 2020年9月我和室友参加“华为杯”第十七届中国研究生数学建模竞赛，我们选择B赛题，其中问题二是关于高维数据的变量选择。该题要求选择变量要具有代表性和独立性，因此我们可知：要求：变量显著、变量独立；路线：模型选择+变量选择、纯变量选择。这个路线是我们解决问题的关键。在实践过程中，我们三人都进行了尝试，发现这两种路线各有优劣。模型选择+变量选择：已知模型选择会导致变量选择结果，因此我们可以先选定一个合适的模型，进而在这个模型基础上进行变量选择，其

2021-08-09 10:44:16 1001

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 生活日常——Python课程作业

原创 变量选择（基于边际贡献最大准则）

空空如也

空空如也

原创生活日常——Python课程作业

原创变量选择（基于边际贡献最大准则）