数据分析
文章平均质量分 78
jassnsnn
这个作者很懒,什么都没留下…
展开
-
动手学数据分析:3.模型搭建和评估
这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那么就需要评估这个模型。我们拥有的泰坦尼克号的数据集,那么我们这次的目的就是,完成泰坦尼克号存活预测这个任务。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport原创 2021-12-23 12:57:33 · 413 阅读 · 0 评论 -
动手学数据分析:2(下)数据可视化
2 第二章:数据可视化开始之前,导入numpy、pandas包和数据# 加载所需的库# 如果出现 ModuleNotFoundError: No module named 'xxxx'# 你只需要在终端/cmd下 pip install xxxx 即可%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline是一个魔法函数(Mag原创 2021-12-19 22:42:18 · 216 阅读 · 0 评论 -
动手写数据分析:2(中)数据重构
2.4 数据的合并2.4.1 将data文件夹里面的所有数据都载入,与之前的原始数据相比,观察他们的之间的关系text_left_up = pd.read_csv("data/train-left-up.csv")text_left_down = pd.read_csv("data/train-left-down.csv")text_right_up = pd.read_csv("data/train-right-up.csv")text_right_down = pd.read_csv("原创 2021-12-17 22:52:06 · 351 阅读 · 0 评论 -
动手学数据分析之 2数据清洗及特征处理
首先大致了解数据清洗。通常情况下我们拿到的数据是会存在缺少值或者有一些异常点等,需要经过一定的处理才能继续后边的分析或建模。所以拿到数据的第一步是进行数据清洗,将数据清洗成可以分析或建模的样子。2.1 缺失值观察与处理我们拿到的数据经常会有很多缺失值,比如有些列存在NaN,那其他列还有没有缺失值,这些缺失值要怎么处理呢2.1.1 缺失值观察(1) 请查看每个特征缺失值个数(2) 请查看Age, Cabin, Embarked列的数据 以上方式都有多种方式#方法一df....原创 2021-12-15 22:11:59 · 2088 阅读 · 0 评论 -
初学动手学数据分析
1.数据加载1.1载入数据1.1.1导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 载入数据(1) 使用相对路径载入数据df = pd.read_csv('train.csv')df.head(3)(2) 使用绝对路径载入数据df = pd.read_csv('/Users/chenandong/Documents/train.csv')df.head(3)1.1.3 每1000行为一个数据.原创 2021-12-14 14:14:20 · 216 阅读 · 0 评论