自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Task05 模型的建立与评估

经过前面的两章的知识点的学习,我们可以对数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我们就需要评估这个模型。这一节我们就学习模型建立和评估,利用泰坦尼克号的数据,预测存活的任务。1模型的建立1.1

2021-06-23 20:55:51 129

原创 Task04 数据可视化

数据可视化复习:回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。1 常见可视化图形数据的可视化能使数据的内在规律、信息更加直观地被展现,不同的可视化图形拥

2021-06-21 22:35:28 602

原创 Task03 数据重构

这一节的任务为数据重构,它仍然是对数据的理解1 数据合并在python中,有三个函数可以将数据合并,分别是concat、join和merge、join,接下来将介绍这三个函数的用法。1、pd.concatpd.concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False,keys=None, levels=None, names=None, verify_integrity=False)常用参数说明:objs:需要合

2021-06-19 19:54:34 126

原创 Task02:数据清洗及特征处理

我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。1 缺失值观察与处理1.1 缺失值观察查看每个特征的缺失值个数有多种方法,以下将展示三种方法。#数据导入import pandas as pdimport numpy as nptrain=pd.read_csv("train.csv")#方法1

2021-06-17 20:57:20 223

原创 Task01 数据加载及探索性数据分析

Task01 数据加载及探索性数据分析Task01以泰坦尼克号数据为例,学习数据的加载及初步观察、pandas基础以及探索性数据分析。1 数据加载及初步观察1.1 载入数据数据载入有两种方式,分别为:以绝对路径载入和以相对路径载入。绝对路径:以根目录为起始点某一文件的路径。相对路径:以某一个文件夹或者文件为参照点来看,其他文件夹或者文件的路径。以绝对路径和相对路径载入数据的python如下所示。import pandas as pd#以绝对路径载入数据data_abs=pd.read_

2021-06-15 22:09:19 366 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除