注册、登录kaggle,使用决策树简单的对Titanic练习

1. 登录 / 注册kaggle

登录不会遇到啥问题;但注册的时候可能会遇到该问题Captcha must be filled out
在这里插入图片描述

  1. 安装插件Header Editor
    插件下载地址:
链接:https://pan.baidu.com/s/1Sk9I6vAHHv8vUc1e3wCYkg?pwd=6as6 
提取码:6as6

2.将解压的文件Header Editor.crx 拖到谷歌的扩展程序中,得到下图所示
在这里插入图片描述
点击详情,找到扩展程序选项,点击之后出现下图
在这里插入图片描述

  1. 配置插件
    导出和导入选项中导入一开始下载的HE-GoogleRedirect.json,即可结束。

  2. 回到注册界面,此时就可以进行谷歌的人机交互了,完成注册。

2. 使用kaggle

  1. 点击kaggle的create —》 New Notebook
    在这里插入图片描述
  2. 图片讲解 在这里插入图片描述
    点击Add Data,输入titanic,选择箭头所指的
    在这里插入图片描述
    得到如下形式
    在这里插入图片描述
    Input下的gender_submission.csv,就是我们需要提交给kaggle的模板样式。
  3. 使用决策树对titanic练习
    则在代码区写入:
import pandas as pd
from sklearn.feature_extraction import DictVectorizer
from sklearn.tree import DecisionTreeClassifier

# 1、获取数据
path_train = "../input/titanic/train.csv"
path_test = "../input/titanic/test.csv"
titanic_train = pd.read_csv(path_train)
titanic_test = pd.read_csv(path_test)

# 筛选特征值和目标值
x_train = titanic_train[["Pclass", "Age", "Sex"]]
y_train = titanic_train["Survived"]
x_test = titanic_test[["Pclass", "Age", "Sex"]]

# 2、数据处理
# 1)缺失值处理
x_train["Age"].fillna(x_train["Age"].mean(), inplace=True)
x_test["Age"].fillna(x_test["Age"].mean(), inplace=True)

# 2) 转换成字典
x_train = x_train.to_dict(orient="records")
x_test = x_test.to_dict(orient="records")

# 4、字典特征抽取
transfer = DictVectorizer()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

# 决策树预估器
estimator = DecisionTreeClassifier(criterion="entropy", max_depth=8)
estimator.fit(x_train, y_train)

# 模型评估   得出预测值
y_predict = estimator.predict(x_test)

# 保存预测值
submission = pd.read_csv('../input/titanic/gender_submission.csv')
submission['Survived'] = y_predict
submission.to_csv('submission.csv', index=False)

运行代码
在这里插入图片描述
在下图得到submission.csv文件
在这里插入图片描述
点击submission.csv 后面的三个小点,Download,下载到本地。然后回到kaggle首页,搜索titanic
在这里插入图片描述
点击下图所指的
在这里插入图片描述
点击Submit Predictions
在这里插入图片描述
在这里插入图片描述
将刚刚下载的submission.csv文件放进去,点击submit,提交。则可看到分数。
在这里插入图片描述
文章部分内容参考:https://blog.csdn.net/weixin_46713695/article/details/125474130

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值