自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 天池二手车预测:建模调参

0.基础知识学习(1)线性回归模型:线性拟合,梯度下降调参,正态分布(2)决策树模型:西瓜书 第四章 决策树学习(3)梯度提升树GBDT学习CART树:二分树,通过寻找最优特征及其最佳切分点划分输入空间 + 剪枝操作GBDT模型是集成模型,是很多CART树的线性相加(4)XGboost模型(5)LightGBM模型import pandas as pdimport numpy ...

2020-04-01 16:29:33 245

原创 天池二手车预测:特征工程

特征工程1. 特征工程目标及主要工作特征工程的目标主要是对特征进行进一步的分析和构造,将数据转换为能更好的表示潜在问题的特征,从而提升机器学习的性能常见的主要工作包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布...

2020-03-28 16:01:49 294

原创 天池二手车价格预测:数据的探索性分析(EDA)

1. 数据的探索性分析理解数据探索在机器学习中我们一般称为EDA(Exploratory Data Analysis):是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。EDA的主要工作包括:(1)数据的初步分析:样本数量,训练集数量,是否有时间特征,是否是时序问题,特征所表示的...

2020-03-24 16:50:21 249

原创 Python学习(北理工MOOC)笔记

Python语言程序设计第一周 Python基本语法元素程序设计基本方法编译和解释:编译:将源代码一次性转换为目标代码的过程解释:将源代码逐条的转换为目标代码同时逐条运行的过程,执行解释过程的程序叫做解释器。根据执行方式不同编程语言分为两类:静态语言(使用编译执行的语言):C,C++,JAVA脚本语言(使用解释器执行的语言):python,PHP,JS比较:静态语言一次性...

2019-06-20 15:10:08 682

原创 LeetCode,转盘锁,set,queue

转盘锁问题描述你有一个带有四个圆形拨轮的转盘锁。每个拨轮都有10个数字: ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’ 。每个拨轮可以自由旋转:例如把 ‘9’ 变为 ‘0’,‘0’ 变为 ‘9’ 。每次旋转都只能旋转一个拨轮的一位数字。锁的初始数字为 ‘0000’ ,一个代表四个拨轮的数字的字符串。列表 deadends 包含了一组死亡...

2019-05-30 12:07:34 99 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除