![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
动手学数据分析
文章平均质量分 93
wensaaaa
这个作者很懒,什么都没留下…
展开
-
动手学数据分析Task05
模型搭建和评估–建模 这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。今天我们学习建模。 首先还是导入库 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns fro原创 2021-07-22 21:00:52 · 201 阅读 · 0 评论 -
动手学数据分析Task04
数据可视化 首先还是导入需要的库和数据,这次除了导入numpy、pandas还要导入matplotlib包。 %matplotlib inline import numpy as np import pandas as pd import matplotlib.pyplot as plt text = pd.read_csv('C:\\Users\\wensa\\Desktop\\hands-on-data-analysis-master\\第二章项目集合\\result.csv') text.head(原创 2021-07-19 17:39:34 · 95 阅读 · 0 评论 -
动手学数据分析Task03
数据重构 数据重构依旧属于数据理解(准备)的范围。 首先还是导入库和数据集, import numpy as np import pandas as pd text = pd.read_csv('/Users/wensa/Desktop/titanic/train_chinese.csv') text.head() 数据的合并 任务一:将data文件夹里面的所有数据都载入,观察数据的之间的关系 text_left_up = pd.read_csv("C:\\Users\\wensa\\Desktop\\h原创 2021-07-16 22:17:53 · 111 阅读 · 0 评论 -
动手学数据分析Task02
数据清洗 首先还是导入numpy、pandas包和数据 import numpy as np import pandas as pd 任务一:缺失值观察 然后先查找缺失值。 查找存在缺失值的列 df.isnull().any() 查找均为缺失值的列 df.isnull().all() 查找存在缺失值的行 nan_lines = df.isnull().any(1) 统计有多少行存在缺失值 nan_lines.sum() 【这些是查找资料是学到的】 题目:查看每个特征缺失值个数 df.isnull(原创 2021-07-15 21:06:47 · 218 阅读 · 0 评论 -
动手学数据分析Task01
学习前准备 Jupyter的用法,这个其实是task00的内容,但还是在进行task01时花费了一定的时间去了解学习。 Kaggle的注册还有数据的下载也花费了一定功夫,在这里很感谢刘楚楚小姐姐的视频,很简洁明白的让我开始了这次的学习。 对Pandas的认识 Pandas 是 Python (opens new window)的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。 Pandas在数据处理方面十分灵活,功能十分强大。 Pandas 基于 NumPy (原创 2021-07-13 22:57:02 · 87 阅读 · 0 评论