数据分析
文章平均质量分 59
吃撑的鲸
这个作者很懒,什么都没留下…
展开
-
python数据挖掘与实战 第四章 数据预处理 数据离散化 代码纠错
在python数据挖掘与实战的第四章代码4-3的数据离散化中发现问题,纠正后代码如下: 标注了改动1.2.3.4.5 # -*- coding: utf-8 -*- # 数据规范化 import pandas as pd datafile = r'D:\mechine learning\Data Analysis and Mining\chapter4\demo\data\discretization_data.xls' # 参数初始化 data = pd.read_excel(datafile)原创 2021-06-03 17:40:00 · 312 阅读 · 1 评论 -
金融风控训练营赛题理解(task 2)学习笔记
金融风控训练营赛题理解(task 2)学习笔记 本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:link Task2目的: 1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模. 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.为特征工程做准备 1、学习知识概要 学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习如何对数据进行统计规整,按条件进行筛选 学习原创 2021-04-25 14:17:53 · 477 阅读 · 0 评论