自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 动手学数据分析Task5第三章 模型搭建和评估--建模

第三章 模型搭建和评估--建模经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模,下一节我们学习评估。我们拥有的泰坦尼克

2021-12-23 17:06:31 930

原创 动手学数据分析Task4数据可视化

复习:回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。目录第二章:数据可视化2.7 如何让人一眼看懂你的数据?2.7.1 任务一:跟着书本第九章

2021-12-20 22:56:12 345

原创 动手学数据分析Task03数据重构

复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。开始之前,导入numpy、pandas包和数据:import pandas as pdimport numpy as nptrain_left_up = pd.read_csv('./data/train-left-up.

2021-12-18 00:09:24 497

原创 动手学数据分析Task2第一节数据清洗及特征处理

第二章:数据清洗及特征处理 我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的亚子。开始之前,导入numpy、pandas包和数据:import pandas as pdimport numpy as nptrain = pd.read_csv('./train.csv')目录...

2021-12-16 17:32:45 739

原创 动手学数据分析task01 数据加载及探索性数据分析(笔记)

一、数据载入及初步观察1. 载入数据1.1 打开JupyterLab 导入numpy、pandas1.2 使用绝对路径、相对路径载入数据首先,使用path1=os.path.abspath('.') 表示当前所处文件夹的绝对路径,print(path1)显示当前绝对路径。使用绝对路径导入数据使用相对路径导入数据1.3 加载文档的方式1.4pd.read_csv与pd.read_tablepd.read_table是以制表符‘\t’作为数据的标志,可以看出,读...

2021-12-14 16:25:25 1943

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除