一、问题描述
kaggle平台是一个大数据商业化平台,在平台上有很多lab和企业会提出很多问题,解答相应的问题也许会有相应的奖金。本文中的titanic是入门级的竞赛题目。
题目大意是根据部分乘客的基本情况来预测其他乘客的生还情况。
二、分析数据
tmp = line.rstrip('\n').split(',')
分析csv训练集中的内容得到乘客基本情况包含以下12个字段字段:
- PassengerId => 乘客ID
- Pclass => 乘客等级(
一、问题描述
kaggle平台是一个大数据商业化平台,在平台上有很多lab和企业会提出很多问题,解答相应的问题也许会有相应的奖金。本文中的titanic是入门级的竞赛题目。
题目大意是根据部分乘客的基本情况来预测其他乘客的生还情况。
二、分析数据
tmp = line.rstrip('\n').split(',')
分析csv训练集中的内容得到乘客基本情况包含以下12个字段字段: