机器学习项目
HU_LSS
这个作者很懒,什么都没留下…
展开
-
特征工程
特征工程很复杂,涉及到的知识非常多,这里就简要叙述几点,以及讨论一下为什么要这么做。 特征是原始数据的数值表示。特征工程就是在给定数据,模型和任务的情况下设计出最合适的特征的过程。 1.什么时候需要对特征进行标准化? K-均值聚类,最近邻方法,径向基核函数,以及所有使用欧式距离的的方法,对于这类模型和模型成分,通常需要对特征进行标准化,以便将输出控制在期望的范围内。相反,逻辑函数对输入的尺度并不敏...原创 2020-03-28 17:35:53 · 227 阅读 · 0 评论 -
1.数据分析
项目竞赛第一章 EDA-数据探索性分析 1.观察数据 通过 .head()和shape简略观察数据 通过 .describe()来观察数据的相关统计量,包括count,mean,std.min,中位数25%,50%,75%,max。这里重点注意的是,如果出现9999999-1等值是nan的另一种表现形式 通过 .info()可以观察到是否有缺失值的情况,并查看特征的数据类型(当类型为object...原创 2020-03-23 19:52:49 · 166 阅读 · 0 评论