![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 63
Vickks
这个作者很懒,什么都没留下…
展开
-
第三章 模型建立及评估
目标:根据泰坦尼克号的数据集完成泰坦尼克号存活预测。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom IPython.display import Imageplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = Fal原创 2022-01-20 20:26:17 · 1006 阅读 · 0 评论 -
第二章第四节 数据可视化
本节主要是通过Python的数据可视化库Matplotlib来实现数据可视化操作。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltre = pd.read_csv('result.csv')可视化展示泰坦尼克号数据集中男女中生存人数分布情况sex = re.groupby('Sex')['Survived'].sum()sex.plot.bar()#条形图plt.title('sex_survi原创 2022-01-17 19:12:58 · 1047 阅读 · 0 评论 -
第二章第二、三节 数据重构
开始前,导入numpy和pandas。import numpy as npimport pandas as pd载入data文件夹中的所有数据,观察数据之间的关系。trlu = pd.read_csv('C://Users/22774/Desktop/data/train-left-up.csv')trru = pd.read_csv('C://Users/22774/Desktop/data/train-right-up.csv')trld = pd.read_csv('C://原创 2022-01-15 15:25:43 · 774 阅读 · 0 评论 -
第一章 数据载入及初步观察
1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdtr=pd.read_csv('train.csv')#使用相对路径载入数据tr=pd.read_csv('C:\\Users\\22774\\Desktop\\hands-on-data-analysis-master\\第一单元项目集合\\train.csv')#使用绝对路径载入数据chunker=pd.read_csv原创 2022-01-10 16:58:26 · 552 阅读 · 0 评论