![](https://img-blog.csdnimg.cn/20190927151043371.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
python数据分析
文章平均质量分 90
python相关内容
qq_36226141
Now is better than never.
展开
-
kaggle泰坦尼克数据之模型建立和评估
第三章 模型搭建和评估–建模经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模,下一节我们学习评估。我们拥有的泰坦尼克号的数原创 2021-06-21 19:16:28 · 730 阅读 · 0 评论 -
kaggle泰坦尼克数据之数据重构
复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。...原创 2021-06-15 15:16:14 · 171 阅读 · 0 评论 -
kaggle泰坦尼克数据之数据清洗及特征处理
2 第二章:数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的亚子。2.1 缺失值观察与处理我们拿到的数据经常会有很多缺失值,比如我们可以看到Cabin列存在NaN,那其他列还有没有缺失值,这些缺失值要怎么处理呢2.1.1 任务一:缺失值观察(1) 请查看每个特征缺失值个数(2) 请查看原创 2021-06-14 17:18:54 · 1003 阅读 · 0 评论 -
kaggle泰坦尼克数据之数据初步处理
1 第一章:数据载入及初步观察1.1 载入数据泰坦尼克号数据集下载1.1.1 任务一:导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 任务二:载入数据(1) 使用相对路径载入数据df = pd.read_csv("train.csv")#相对路径df.head()(2) 使用绝对路径载入数据import osos.getcwd() #查看当前工作目录df = pd.read_csv("train.csv的绝对路原创 2021-06-14 14:35:01 · 673 阅读 · 0 评论