自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 win10安装CUDA+cuDNN+Pytorch+PyG

一起动手学习神经网络——Pytorch和PYG包的安装总结了多篇文档的内容,把自己安装的步骤写下来,以便在后续过程中直接进行安装。第一步:安装Visual Studio 2017,并且选好 C++/CLI support和VC++ 2015.3 v14.00(v140) toolset for Desktop两个在visual C+++ build tools下面的包;先下载在线安装版,运行起来后选择性安装。如果不进行第一步,直接安装cuda会在最后一部报错,切记。第二步:安装cuda。什么是

2021-06-19 12:11:46 420 1

原创 记录我的组队学习之路——基于二手车价格预测比赛——特征筛选、建模、优化

前面已经通过特征工程对特征进行了预处理,并且构造了新的特征,接下来我们就可以进行建模,筛选特征、调参优化。总体思路如下:使用树模型(xgb/randomForest)看一下现所有特征建模结果,以此作为一个基准;选择入模特征;使用xgb、randomForest、lightgbm分别进行建模,选出冠军模型;对冠军模型参数进行调节,保存模型可尝试学习模型融合。初次建模我使用xgb模...

2020-04-11 09:59:54 302

原创 记录我的组队学习之路——基于二手车价格预测比赛——特征工程

**什么是特征过程**我自己的理解就是我们在建模解决实际问题时,会在建模前收集可能与实际业务有关的特征,但这些特征可能是一些单一的特征,通过EDA也发现这些特征值有异常值,缺失值等,不同的模型对特征的要求不同,这些特征直接进入模型的效果往往不好,因此,我们需要对特征进行清洗,加工,筛选最终进入模型。以下数据处理过程以二手车价格预测比赛为例**异常值处理**异常值处理方法有很多如3西格玛法,...

2020-03-31 15:36:17 164

原创 记录我的组队学习之路——基于二手车价格预测比赛——EDA

EDA探索性数据分析(Exploratory Data Analysis 简称EDA)是一种分析数据集以概括其主要特征的方法,通常使用可视化方法,不同于初始数据分析(IDA),它更集中于检查模型拟合和假设检验所需的假设,以及处理缺少的值,并根据需要进行变量转换。EDA包含IDA。探索性分析的过程:1.形成假设,确定主题去探索;2.清理数据;3.评价数据质量;4.数据报表;5.探索分析...

2020-03-23 19:08:03 164

原创 记录我的组队学习之路——基于二手车价格预测比赛——赛题理解

自从毕业之后,都没有好好的系统性进行数据挖掘学习了,基于datawhale这次组织的组队学习,以赛练技,加深自己对数据挖掘过程各个环节的理解。理解赛题数据目标:对二手车价格进行预测。*[平常我做的一般都是预测类模型,这次是回归型模型可以好好学一下。]训练集:15W;测试集A:5W;测试集B:5W;两个测试集的设置的作用是什么,跨时间,跨区域?特征个数:31个,其中15个匿名变量。...

2020-03-23 10:40:42 178

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除