自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 生活日常——Python课程作业

文章目录背景一、数据预处理1、空值2、独热编码二、绘图三、数据模型选取及拟合两步模型两步模型——第一个模型(仅判断是否有工作)两步模型——第二个模型(仅估计工资高低)两步模型——总结一步模型总结 背景 Python课期末考核之一是个人课程大作业,老师只有以下要求: 1、从Kaggle上找一个数据集并进行分析; 2、必须使用Python。 这个大作业的自由度很高,选题内容很宽泛。我选择一个关于工资预测的数据集,共14个变量215个数据点。 一、数据预处理 我选取Kaggle数据库中的Placeme

2021-08-11 15:54:37 482

原创 变量选择(基于边际贡献最大准则)

变量选择(仅一种方法——边际贡献最大) 可行路线及分析 2020年9月我和室友参加“华为杯”第十七届中国研究生数学建模竞赛,我们选择B赛题,其中问题二是关于高维数据的变量选择。该题要求选择变量要具有代表性和独立性,因此我们可知: 要求:变量显著、变量独立; 路线:模型选择+变量选择、纯变量选择。 这个路线是我们解决问题的关键。在实践过程中,我们三人都进行了尝试,发现这两种路线各有优劣。 模型选择+变量选择:已知模型选择会导致变量选择结果,因此我们可以先选定一个合适的模型,进而在这个模型基础上进行变量选择,其

2021-08-09 10:44:16 1001

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除