- 博客(4)
- 收藏
- 关注
原创 统计学习方法第二版(第二章)感知机
感知机基础知识介绍超平面偏导数和梯度感知机模型选取模型策略梯度下降算法基础知识介绍超平面偏导数和梯度感知机模型选取模型策略梯度下降算法
2021-04-26 19:51:52
418
2
原创 二手车价格预测-TASK2-EDA数据分析
数据分析(EDA):(为特征筛选准备)一、数据概览:1.数据分布(四分位数、均值、方差、最大值、最小值等) describe:a)min max远超过平均值或者中位数,那么可能是有异常值,或者是偏态分布。b)train和test的均值、标准差等是否一致,如果不一致说明训练集和测试集的分布不同分布不同可能需要对训练集进行采样,使其和测试集分布一样,从而达到更好的效果。2.数据类型与缺失值 info:了解数据type,有助于理解除了nan以外的特殊符号异常(object)。了解缺失值,isnul
2021-04-16 17:31:23
238
原创 Datawhale 零基础入门数据挖掘-二手车价格预测
Datawhale 零基础入门数据挖掘-Task1 赛题理解今天开始参加天池和datawhale联合举办的二手车价格预测比赛,是对新手十分的友好的零基础数据挖掘比赛。接下来我们将这个比赛分为多个task,其中task1是赛题整体的理解把握,task2是EDA(也就是数据挖掘分析),task3是特征工程,task4是数据建模,task5是模型融合。这也是我第一次参加数据挖掘类赛事,不求完全精深,但是求思维的广度得到扩展。就像“西瓜书”的作者所说,先对所学有一个总览,再来追求深度。这也和我们大脑的学习习惯有
2021-04-13 19:10:34
166
原创 统计学习方法第二版(第一章)学习笔记
第一章解释了机器学习是什么,数据为什么可以通过模型预测,模型又是什么,怎么选模型和怎么训练模型?作者对我们的疑虑进行了深层的探索,并且用了很多理论去支撑自己的观点,接下来我们省去一些背景介绍和复杂的公式推理,直接由浅入深学习这些知识。首先,机器学习是什么?起初,我们想通过历史数据找到一些规律,并拿它来预测新的事物。(比如我们通过观察前几天的天气,发现多云的天气往往会下雨,而今天恰好是多云的天气,因此我们预测今天很有可能会下雨。)找到规律意味着我们假设每个单一事件的发生都不是个例,而是服从于总体的一些
2021-04-07 00:41:10
266
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人