![](https://img-blog.csdnimg.cn/bb19d422161c4f98916a13756bd122b8.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
《机器学习算法竞赛实战》学习笔记
文章平均质量分 93
试图督促自己学习
全自动学习机器
不务正业使人收获快乐
展开
-
《机器学习算法竞赛实战》学习笔记4.特征工程
吴恩达老师有言:“机器学习在本质上还是特征工程,数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限而已。”特征工程主要分为:数据预处理、特征变换、特征提取、特征选择四部分#mermaid-svg-Ybe7a9ZvmxjBI7JK {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-Ybe7a9ZvmxjBI7JK .error-icon{fill:#552222;}原创 2022-03-15 19:47:03 · 1885 阅读 · 0 评论 -
《机器学习算法竞赛实战》学习笔记3.数据探索
如何确保自己准备好竞赛使用的算法模型?如何为数据集选择最合适的算法?如何定义可用于算法模型的特征变量?数据探索可以帮助回答以上三点。一般而言,数据探索可以分为三个部分:首先是赛前数据探索,帮助我们对数据有个整体性的认识,并发现数据中存在的问题,比如缺失值、异常值和数据冗余等其次是竞赛中的数据探索,通过分析数据发现变量的特点,帮助提取有价值的特征,这里可以从单变量、多变量和变量分布进行分析最后是模型的分析,可以分为重要性分析和结果误差分析,帮助我们从结果发现问题,并进一步优化#mermaid-s原创 2022-02-15 23:47:44 · 992 阅读 · 0 评论 -
《机器学习算法竞赛实战》学习笔记2.问题建模
拿到赛题,应首先考虑问题建模,同时完成基线(baseline)模型的管道(pipeline)搭建,以第一时间获得结果上的反馈。竞赛中的问题建模主要可分为赛题理解、样本选择、线下评估策略三个部分。#mermaid-svg-5v7qW5VKF9awDP2Q .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-5v7qW原创 2022-02-14 16:06:04 · 927 阅读 · 0 评论 -
《机器学习算法竞赛实战》学习笔记1.竞赛简介
本文是《机器学习算法竞赛实战》(人民邮电出版社)的笔记的第一篇,希望可以通过这样的方式督促自己学习。第1章.初见竞赛1.竞赛平台简介1.1Kaggle1.1.1概况Overview1.1.2数据Data1.1.3代码笔记Code1.1.4论坛Discussion1.1.5排行榜Leaderboard1.1.6规则Rules1.2天池1.3DataFountain(DF)1.4DataCastle(DC)1.5Kesci1.6JDATA2.竞赛流程2.1问题建模2.2数据探索2.3特征工程2.4模型训练2.原创 2022-02-11 18:55:04 · 1314 阅读 · 4 评论