面向机器学习的特征工程翻译版

前些日子推荐了一个仓库,是知名开源apachecn组织翻译的《面向机器学习的特征工程》英文版,可以说是特征工程的宝典,值得推荐。

仓库说明

知名开源apachecn组织翻译了《面向机器学习的特征工程》英文版,可以说是特征工程的宝典,值得推荐:

仓库地址:

https://github.com/apachecn/feature-engineering-for-ml-zh

文件目录

  • 一、引言

  • 二、简单数字的奇特技巧

  • 三、文本数据:展开、过滤和分块

  • 四、特征缩放的效果:从词袋到 TF-IDF

  • 五、类别特征:机器鸡时代的鸡蛋计数

  • 六、降维:使用 PCA 压缩数据集

  • 七、非线性特征提取和模型堆叠

  • 八、自动化特征提取器:图像特征提取和深度学习

  • 九、回到特征:将它们放到一起

  • 附录、线性模型和线性代数基础

内容简介

第 1 章从数字数据的基本特征工程开始:过滤,合并,缩放,日志转换和能量转换以及交互功能。

第 2 章和第 3 章深入探讨了自然文本的特征工程:bag-of-words,n-gram 和短语检测。

第 4 章将 tf-idf 作为特征缩放的例子,并讨论它的工作原理。

围绕第 5 章讨论分类变量的高效编码技术,包括特征哈希和 bin-counting,步伐开始加速。

当我们在第 6 章中进行主成分分析时,我们深入机器学习的领域。

第 7 章将 k-means 看作一种特征化技术,它说明了模型堆叠的有效理论。

第 8 章都是关于图像的,在特征提取方面比文本数据更具挑战性。在得出深度学习是最新图像特征提取技术的解释之前,我们着眼于两种手动特征提取技术 SIFT 和 HOG。

第 9 章中完成了一个端到端示例中的几种不同技术,为学术论文数据集创建了一个推荐器。

总结

知名开源apachecn组织翻译了《面向机器学习的特征工程》英文版,可以说是特征工程的宝典,值得推荐:

仓库地址:

https://github.com/apachecn/feature-engineering-for-ml-zh

请关注和分享↓↓↓ 

本站的知识星球(黄博的机器学习圈子)ID:92416895

目前在机器学习方向的知识星球排名第一

往期精彩回顾

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值