数据挖掘
dayday学习
学习刷题,天天向上
展开
-
数据挖掘task3特征工程
数据挖掘task3特征工程1.特征工程1.1 常见的特征工程1.2 代码实战1.特征工程特征工程是对数据进一步分析和对数据进行处理。1.1 常见的特征工程1 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断;2 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布...原创 2020-03-27 19:33:59 · 232 阅读 · 0 评论 -
数据挖掘_task2数据探索分析
数据挖掘_task2数据探索分析EDA1.前言2.内容介绍2.1 读取数据并查看大体信息2.1.1读取数据2.1.2 查看数据信息2.1.2.1 数据集的概况2.1.2.2 判断数据缺失和异常2.1.2.3 预测值的分布2.1.2.4 特征值的分布2.1.2.5 特征值分析2.1.3 pandas_profiling生成数据报告1.前言EDA目标EDA的价值主要在于熟悉数据集,了解数据...原创 2020-03-20 21:59:05 · 655 阅读 · 0 评论 -
数据挖掘_task1赛题分析
task1赛题分析1.理解赛题1.1 赛题要求1.2 数据1.2.1 预测指标1.3 读取数据代码1.4 查看一些pandas 自带对数据得统计1.理解赛题赛题:零基础入门数据挖掘 - 二手车交易价格预测1.1 赛题要求比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格。来自 Ebay Kleinanzeigen 报废的二手车,数量超过 370,000,包含 20 列变量信息...原创 2020-03-20 16:10:39 · 2007 阅读 · 0 评论