从入门到狂热,特征工程必学的几项资源

640?wx_fmt=png

前些日子发了一篇自己对于

在分享资源前,我想先说说自己对于特征工程的看法,其实做数据挖掘、机器学习、人工智能相关的同学,应该都会比较清楚特征工程的重要性,而且,也知道这块是十分耗时耗力的,特征作为数据与模型之间的桥梁,对数据规律进行更好的表现往往有助于构建出效果更好的模型,从而对我们的业务有显著的帮助。由于特征工程在很多地方都有应用,不同的场景,数据的样子千奇百怪,很难说有一套标准的特征处理套路去解决,所以作为从业者,我个人觉得更为重要的是培养自己总结经验的能力,针对自己所在的行业、工作场景去设计更加符合自己使用的代码库,而这一切并不是立竿见影的,也是需要你有一些基本原则,关于特征工程的基本原则,所以,我们得去看很多的资源,学习其基本的处理思想,融会贯通。

话不多说,下面的资源是个人的一点点总结,后续随着自己的探索估计还是会增加内容,这些就先看着先呗。
640?wx_fmt=jpeg


? 学习视频

视频看起来可能会比较慢一些,但也会记忆地更加深刻,不过我通常都是开1.25倍数去看,看到熟悉的就可能会到1.5倍数(这个看大家喜欢了哈哈),对于入门的同学,我个人还是推荐去看视频会好一点,毕竟书籍看起来还是会比较困的。
1)加州理工学院公开课:机器学习与数据挖掘
传送门: http://open.163.com/special/opencourse/learningfromdata.html
2)B站:机器学习-特征工程-唐宇迪
传送门: https://b23.tv/av52783056/p1

? 学习书籍

书籍也推荐几本特征工程相关的,可能还要一些好书,如果大家有看过其他相关的好书的,希望可以告诉我呀~
1)《精通特征工程》,原名叫《Feature Engineering for Machine Learning》,作者爱丽丝、阿曼达,译者陈光欣
2)《机器学习实战》,作者Peter Harrington
3)《数据挖掘-实用机器学习技术》,作者 Lan H.Witten/Eibe Frank
4)《统计学习方法》,作者李航
5)《机器学习》,也就是我们常说的“西瓜书”,作者周志华,里面的部分章节有涉及
6)《面向机器学习的特征工程》,作者Alice Zheng &Amanda Casari
7)《python数据分析与挖掘实战》,作者张良均、王路、谭立云、苏剑林等

? 竞赛思路

特征工程如果脱离了实际的场景,看起来还是有点像纸上谈兵,因此我推荐你们也去看一些竞赛经验总结,可以结合比赛内容,看下高手们的思路。这里主要推荐一个GitHub项目,有相关竞赛经验的总结: https://github.com/AI-Sphere/Awesome-Noah
其余的,可能就需要大家去浏览各种竞赛网站,如kaggle、天池、科大讯飞等等,看那些大神们的思路。

以上,是本人对于特征工程学习的一些小总结,恳请指教,另外,如果同学们有更好的资源,希望可以告诉我嘻嘻~ 互相学习进步~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值