阿里云天池学习笔记

一、准备工作

注册阿里云,云算力平台

赛事链接:零基础入门数据挖掘 - 二手车交易价格预测_学习赛_天池大赛-阿里云天池的赛制

二、baseline

1.one-hot编码
每个唯一的分类值都被赋予一个唯一的二进制向量,也被称为独热向量,因为在这个向量中, 
只有一个位置的元素是1(表示该类别的存在),其余所有位置的元素都是0 
如,猫、狗、鸟三分类中,猫可以被编码为[1,0,0],狗为[0,1,0],乌为[0,0,1] 

2.梯度下降

【深度学习】梯度下降(通俗易懂)_深度学习梯度下降-CSDN博客

3.特征缩放(归一化) 
使用原因
使用单一指标对某事物进行评价并不合理,因此需要多指标综合评价方法,多指标综合评价方法,就是把描述某事物不同方面的多个指标综合起来得到一个综合指标,并通过它评价、比较该事物。 由于性质不同,不同评价指标通常具有不同的量纲和数量级。当各指标相差很大时,如果直接使用原始指标值计算综合指标,就会突出数值较大的指标在分析中的作用、削弱数值较小的指标在分析中的作用。 
为消除各评价指标间旨纲和数量级的差异、保证结果的可充性,就需要对各指标的原始数据进行特征缩放(也有数据标准化、数据归一化的说法,但这些叫法不准确,所以不推荐)。 
由于量纲和数量级不同,所以需要特征缩放,特征缩放可以显著提升部分机器学习算法的性能,但它对部分算法没有帮助。

三、赛事讲解

1.定义解压.zip包函数,进行解包

2.以空格为分离字符处理数据

3.处理离散数据,连续数据,(可能)无关数据

 

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值