机器学习第五课--广告点击率预测项目以及特征选择的介绍

这个项目的主要的目的是通过给定的广告信息和用户信息来预测一个广告被点击与否。 如果广告有很大概率被点击就展示广告,如果概率低,就不展示。 因为如果广告没有被点击,对双方(广告主、平台)来讲都没有好处。所以预测这个概率非常重要,也是此项目的目标。

在这个项目中,你需要完成以下的任务:

1.数据的读取和理解: 把给定的.csv文件读入到内存,并通过pandas做数据方面的统计以及可视化来更深入地理解数据。

2.特征构造: 从原始特征中衍生出一些新的特征,这部分在机器学习领域也是很重要的工作。

3.特征的转化: 特征一般分为连续型(continuous)和类别型(categorical), 需要分别做不同的处理。

4.特征选择: 从已有的特征中选择合适的特征,这部分也是很多项目中必不可少的部分。

5.模型训练与评估: 通过交叉验证方式来训练模型,这里需要涉及到网格搜索等技术。

特征选择 

防止过拟合,以及噪声 

1.尝试所有的组合---能够得到全局最优解

2.贪心算法

f4最好,就放进去,然后再放另外的,反复用贪心算法加进去

3.L1正则

有缺点,有不可导的点

4.树算法(决策树)

根节点最好,接着是下一层,再下一层

5.相关性计算

和最终目标相关性越大,越好

超参数的搜索 

1.网格搜索--遍历

给定超参数的取值范围进行搜索

2.启发式搜索

启发式是有一个点很好,就在他周围找,要是不好,就不在他的周围找了。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值