kaggle实战之流浪猫狗归处预测

介绍

每年,约有760万个动物到达美国的动物收留所。 许多动物被他们的主人丢弃,而其它一部分是因为走失。 这些动物中的大多数都会找到永远的家庭并把它们带回家,但也有许多动物不那么幸运。 美国每年约有270万只狗和猫被安乐死。

使用奥斯汀动物中心的摄入信息数据集,包括品种,颜色,性别和年龄,我们要求Kagglers预测每只动物的结果。

我们也相信这个数据集可以帮助我们理解动物结果的趋势。 这些见解可以帮助避难所将精力集中在需要额外帮助寻找新家的特定动物身上。

这场比赛就是为了能够更准确的预测出每个动物的未来命运~~~

数据

下面来看下kaggle发布的训练数据吧:

这里写图片描述

训练数据主要包括每个动物的ID以及品种、类型和颜色等。

下面是测试数据:

这里写图片描述

每个Animal ID都有五种可能的结果:收养,死,安乐死,Return_to_owner,转移。这是一个典型的多类分类问题。好了,不多说了,看代码吧(很清楚)~~~

代码

import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.grid_search import GridSearchCV
import sys
from datetime import datetime


def munge(data, train):
    data['HasName'] = data['Name'].fillna(0)
    data.loc[data['HasName'] != 0, "HasName"] = 1
    data['HasName'] = data['HasName'].astype(int)
    data['AnimalType'] = data[
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值