自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 第三章 模型建立及评估

目标:根据泰坦尼克号的数据集完成泰坦尼克号存活预测。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom IPython.display import Imageplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = Fal

2022-01-20 20:26:17 1033

原创 第二章第四节 数据可视化

本节主要是通过Python的数据可视化库Matplotlib来实现数据可视化操作。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltre = pd.read_csv('result.csv')可视化展示泰坦尼克号数据集中男女中生存人数分布情况sex = re.groupby('Sex')['Survived'].sum()sex.plot.bar()#条形图plt.title('sex_survi

2022-01-17 19:12:58 1063

原创 第二章第二、三节 数据重构

开始前,导入numpy和pandas。import numpy as npimport pandas as pd载入data文件夹中的所有数据,观察数据之间的关系。trlu = pd.read_csv('C://Users/22774/Desktop/data/train-left-up.csv')trru = pd.read_csv('C://Users/22774/Desktop/data/train-right-up.csv')trld = pd.read_csv('C://

2022-01-15 15:25:43 787

原创 第二章第一节 数据清洗及特征处理

2.1 缺失值观察与处理import numpy as npimport pandas as pdtr=pd.read_csv('train.csv')

2022-01-11 11:37:46 272

原创 第一章 数据载入及初步观察

1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdtr=pd.read_csv('train.csv')#使用相对路径载入数据tr=pd.read_csv('C:\\Users\\22774\\Desktop\\hands-on-data-analysis-master\\第一单元项目集合\\train.csv')#使用绝对路径载入数据chunker=pd.read_csv

2022-01-10 16:58:26 560

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除