动手数据分析
文章平均质量分 93
BuSong.
这个作者很懒,什么都没留下…
展开
-
模型搭建和评估 —— 泰坦尼克任务
第二章:模型搭建和评估开始之前,加载下面的库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom IPython.display import Image%matplotlib inlineplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicod原创 2022-03-20 13:47:51 · 1226 阅读 · 0 评论 -
数据可视化 —— 泰坦尼克任务
第二章:数据可视化开始之前,导入numpy、pandas以及matplotlib包和数据#导入numpy、pandas以及matplotlib包import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 导入数据(result.csv这个文件)df = pd.read_csv(r'result.csv')df.head()2.7 如何让人一眼看懂你的数据?2.7.1 任务一:跟着书本第九章,了解matpl原创 2022-03-18 15:38:08 · 3455 阅读 · 1 评论 -
数据重构 —— 泰坦尼克任务
第二章:数据重构熟悉的开始~# 导入numpy和pandasimport pandas as pdimport numpy as np# 载入data文件中的:train-left-up.csvleft_up = pd.read_csv('train-left-up.csv')left_up.head()2.4 数据的合并2.4.1 任务一:将data文件夹里面的所有数据都载入,观察数据的之间的关系# 载入data文件中的:train-left-down.csvleft_down原创 2022-03-17 15:16:36 · 250 阅读 · 0 评论 -
数据清洗及特征处理 —— 泰坦尼克任务
第二章:数据清洗及特征处理熟悉的开始~# 导入numpy和pandasimport pandas as pdimport numpy as np#加载数据train.csvdf = pd.read_csv('train.csv')df2.1 缺失值观察与处理2.1.1 任务一:缺失值观察(1) 请查看每个特征缺失值个数# 查看数据内缺失值字段df.info()# 查看每个特征缺失值个数df.isnull().sum()info()用于打印DataFrame的简要摘要,原创 2022-03-16 14:46:58 · 3064 阅读 · 0 评论 -
数据载入及初步观察 + 探索性数据分析 —— 泰坦尼克任务
第一章:数据载入及初步观察实验代码1.1 载入数据1.1.1 任务一:导入numpy和pandas# 导入numpy和pandasimport pandas as pdimport numpy as np1.1.2 任务二:载入数据注:上传本地数据 [ 在 Jupyter 中操作需要 Upload](1) 使用相对路径载入数据pd.read_csv('train.csv')(2) 使用绝对路径载入数据import os # 添加此头文件 否则会报错# 查询数据集的绝对路径o原创 2022-03-14 17:49:45 · 2563 阅读 · 1 评论