自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 贪心算法:会场安排问题

贪心算法:会场安排问题 问题重述:会场安排即使用尽可能少的会场来安排给定数量的活动,其中活动的安排必须遵循开始时间和结束时间的约束。 简述一下思路,就是运用贪心的思想,先排序,后选择,把活动的结束时间作为排序指标,按从小到大排列,选择时遵循时间上的约束。 这里不妨设定一下存储数据的结构为结构体,然后在一个结构体数组里边进行初始化。 struct event{ int start;//活动开始时间 int end;//活动结束时间 bool isPlanned;//活动是否被安排过了 }; 使用C++

2021-06-13 10:51:20 397

原创 数据挖掘task5:模型融合

模型融合 对于比赛来说:模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。 简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 boosting...

2020-04-04 19:40:08 195

原创 数据挖掘task4:建模调参

建模调参 首先引入数据 import pandas as pd import numpy as np import warnings warnings.filterwarnings('ignore') def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the da...

2020-04-01 16:31:14 288

原创 数据挖掘task3:特征工程

这里写目录标题特征工程异常值的删除特征构造特征筛选 特征工程 对于特征工程的描述有许多,这里捡笔者认为重要的说一个 特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。 而特征工程的好坏优劣也往往成为各类比赛的关键点,其意义还是决定了它值得各位的重视。 而这篇文字主要介绍的是关于异常值,特征构造还有特征筛选的内容以及一些个人理解 异常值的删除 导入数据部分...

2020-03-28 19:31:17 185

原创 数据挖掘零基础--task2数据分析

EDA数据探索性分析 内容摘要 载入库 载入数据 数据总览 缺失与异常 预测值分布 类别特征和数字特征,并对类别特征查看unique分布 数字特征分析及可视化 类型特征分析及可视化 用pandas_profiling生成数据报告 对各种python数据库的安装与载入 使用jupyter notebook 其中绝大多数可以使用pip install指令在cmd界面进行安装,不能的附地址和安装方法...

2020-03-24 13:49:38 238

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除