![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Data_Analysis
zhuo_bao
这个作者很懒,什么都没留下…
展开
-
Data_Analysis_task5
第三章 模型搭建和评估经过前面的探索性数据分析我们可以很清楚的了解到数据集的情况import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Image%matplotlib inlineplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcP原创 2020-08-26 18:07:16 · 265 阅读 · 0 评论 -
第二章:第四节数据可视化-课程
**复习:**学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。2 第二章:数据可视化开始之前,导入numpy、pandas以及matplotlib包和数据# 加载所需的库# 如果出现 ModuleNotFoundError: No module named 'xxxx原创 2020-08-24 15:38:04 · 431 阅读 · 0 评论 -
Data_Analysis_task3
复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。开始之前,导入numpy、pandas包和数据# 导入基本库import pandas as pdimport numpy as np# 载入data文件中的:train-left-up.csvdf=pd.read_csv(原创 2020-08-22 21:03:45 · 224 阅读 · 0 评论 -
Data_Analysis_数据清洗及特征处理
数据清洗首先导入numpy、pandas包和数据集#加载所需的库import pandas as pdimport numpy as np#加载数据train.csvdf=pd.read_csv('F:\Datewheel资料\hands-on-data-analysis-master\hands-on-data-analysis-master\第一单元项目集合/train.csv')df.head() PassengerId S原创 2020-08-21 14:26:49 · 523 阅读 · 0 评论 -
Data_Analysis_数据载入及探索性分析
数据载入在进行数据分析之前,我们首先需要将数据集导入到python中。1、先导入需要的包import pandas as pdimport numpy as np2、导入数据:数据的格式有多种,如:csv格式,xlsx格式,tsv格式等,都可用pandas中的方法导入。df=pd.read_csv('F:\Datewheel资料\hands-on-data-analysis-master\hands-on-data-analysis-master\第一单元项目集合/train.csv')df原创 2020-08-18 21:18:54 · 822 阅读 · 0 评论