数据分析
文章平均质量分 81
黑小板
纸上得来终觉浅
展开
-
数据分析学习笔记(五)
心电图Task05 模型融合 比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction 学习目标 学习不同的模型融合策略 加权融合、Stacking融合代码实现 内容介绍 模型融合是提升模型得分最重要的方式之一,大体来说有如下的类型方式。 简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(原创 2021-03-28 20:20:50 · 217 阅读 · 0 评论 -
数据分析学习笔记(四)
心电图Task04 模型调参 比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction 学习目标 学习机器学习模型的几种调参方法 熟悉lightgbm分类的各参数意义 五种调参方法 调参方法介绍参考地址 调参原理展示图参考地址 调参方法代码实现参考地址 手动调参 根据经验设置、调整参数。优点:经验丰富的工程师可以节省调参时间,减少硬件资源消耗。缺点:十分依赖经验,对初级工程师不友好,无法找到全局最优解。 贪心原创 2021-03-25 16:44:47 · 137 阅读 · 0 评论 -
数据分析学习笔记(三)
心电图Task03 特征工程 比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction 学习目标 学习时间序列数据的特征预处理方法 学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用 内容介绍 数据预处理 时间序列数据格式处理 加入时间步特征time 特征工程 时间序列特征构造 特征筛选 使用 tsfresh 进行时间序列特征处理 代码示例 1 导入包并读取数据 # 包原创 2021-03-22 22:09:14 · 164 阅读 · 0 评论 -
数据分析学习笔记(二)
心电图Task02 EDA-数据探索性分析。 比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction 1. EDA 目标 了解数据集,熟悉数据类型、数据分布等。 了解变量间的相互关系、变量与预测值之间的关系。 为数据处理和特征工程做准备。 2. EDA 主要内容 数据观察: 观察数据集首尾概况 观察数据集shape 数据总览: 通过describe()来熟悉数据的相关统计量 通过info()来熟悉数据类型原创 2021-03-18 16:28:21 · 338 阅读 · 2 评论 -
数据分析学习笔记(一)
心电图Task01 理解赛题数据和目标 解题思路 baseline方案及结果 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客: 全新的界面设计 ,将会带来全新的写作体验; 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码原创 2021-03-16 17:28:25 · 237 阅读 · 1 评论