自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 统计学习方法第二版(第二章)感知机

感知机基础知识介绍超平面偏导数和梯度感知机模型选取模型策略梯度下降算法基础知识介绍超平面偏导数和梯度感知机模型选取模型策略梯度下降算法

2021-04-26 19:51:52 418 2

原创 二手车价格预测-TASK2-EDA数据分析

数据分析(EDA):(为特征筛选准备)一、数据概览:1.数据分布(四分位数、均值、方差、最大值、最小值等) describe:a)min max远超过平均值或者中位数,那么可能是有异常值,或者是偏态分布。b)train和test的均值、标准差等是否一致,如果不一致说明训练集和测试集的分布不同分布不同可能需要对训练集进行采样,使其和测试集分布一样,从而达到更好的效果。2.数据类型与缺失值 info:了解数据type,有助于理解除了nan以外的特殊符号异常(object)。了解缺失值,isnul

2021-04-16 17:31:23 238

原创 Datawhale 零基础入门数据挖掘-二手车价格预测

Datawhale 零基础入门数据挖掘-Task1 赛题理解今天开始参加天池和datawhale联合举办的二手车价格预测比赛,是对新手十分的友好的零基础数据挖掘比赛。接下来我们将这个比赛分为多个task,其中task1是赛题整体的理解把握,task2是EDA(也就是数据挖掘分析),task3是特征工程,task4是数据建模,task5是模型融合。这也是我第一次参加数据挖掘类赛事,不求完全精深,但是求思维的广度得到扩展。就像“西瓜书”的作者所说,先对所学有一个总览,再来追求深度。这也和我们大脑的学习习惯有

2021-04-13 19:10:34 166

原创 统计学习方法第二版(第一章)学习笔记

第一章解释了机器学习是什么,数据为什么可以通过模型预测,模型又是什么,怎么选模型和怎么训练模型?作者对我们的疑虑进行了深层的探索,并且用了很多理论去支撑自己的观点,接下来我们省去一些背景介绍和复杂的公式推理,直接由浅入深学习这些知识。首先,机器学习是什么?起初,我们想通过历史数据找到一些规律,并拿它来预测新的事物。(比如我们通过观察前几天的天气,发现多云的天气往往会下雨,而今天恰好是多云的天气,因此我们预测今天很有可能会下雨。)找到规律意味着我们假设每个单一事件的发生都不是个例,而是服从于总体的一些

2021-04-07 00:41:10 266 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除