特征工程在机器学习中的作用不言而喻了,这本书就是关于如何进行特征工程进行了非常系统的描述,GitHub上有一个项目也把这本外文书翻译成了中文版,今天给大家分享一下,大家可以收藏一下哦,写进自己的学习计划,开始“修炼内功”吧!
仓库说明
知名开源apachecn组织翻译了《面向机器学习的特征工程》英文版,可以说是特征工程的宝典,值得推荐:
仓库地址:
https://github.com/apachecn/feature-engineering-for-ml-zh
文件目录
一、引言
二、简单数字的奇特技巧
三、文本数据:展开、过滤和分块
四、特征缩放的效果:从词袋到 TF-IDF
五、类别特征:机器鸡时代的鸡蛋计数
六、降维:使用 PCA 压缩数据集
七、非线性特征提取和模型堆叠
八、自动化特征提取器:图像特征提取和深度学习
九、回到特征:将它们放到一起
附录、线性模型和线性代数基础
内容简介
第 1 章从数字数据的基本特征工程开始:
过滤,合并,缩放,日志转换和能量转换以及交互功能。
第 2 章和第 3 章深入探讨了自然文本的特征工程:
bag-of-words,n-gram 和短语检测。
第 4 章将 tf-idf 作为特征缩放的例子,并讨论它的工作原理。
围绕第 5 章讨论分类变量的高效编码技术,包括特征哈希和 bin-counting,步伐开始加速。
当我们在第 6 章中进行主成分分析时,我们深入机器学习的领域。
第 7 章将 k-means 看作一种特征化技术,它说明了模型堆叠的有效理论。
第 8 章都是关于图像的,在特征提取方面比文本数据更具挑战性。
在得出深度学习是最新图像特征提取技术的解释之前,我们着眼于两种手动特征提取技术 SIFT 和 HOG。
第 9 章中完成了一个端到端示例中的几种不同技术,为学术论文数据集创建了一个推荐器。
总结
知名开源apachecn组织翻译了《面向机器学习的特征工程》英文版,可以说是特征工程的宝典,值得推荐:
仓库地址:
https://github.com/apachecn/feature-engineering-for-ml-zh
文 章 推 荐 ?
Nice!?
如果觉得不错~
欢迎点击右下角的 “在看” 鼓励鼓励~
顺便扫码关注一下哦~