Kaggle实战入门（四）之Cat-In-The-Dat-ii

kiligso

于 2020-09-21 00:12:20 发布

阅读量1k

点赞数 5

分类专栏： kaggle实战文章标签：机器学习深度学习人工智能 python 大数据

本文链接：https://blog.csdn.net/kiligso/article/details/108700696

版权

第四个项目比较简单和有趣，因为它的数据集全部都是分类型特征，在这种情况下，我们又应该怎么做呢。在这里给大家分享一个比较好用的模型catboost和对分类型特征处理的编码方式TargetEncoder。在这个项目中可以方便快捷的对数据进行处理和建模。

Part1.数据导入

import numpy as np
import pandas as pd
import os
from sklearn.exceptions import ConvergenceWarning
import warnings

warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.simplefilter(action='ignore', category=ConvergenceWarning)


train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# separate target, remove id and target
test_ids = test['id']
target = train['target']
train.drop(columns=['id', 'target'], inplace=True)
test.drop

最低0.47元/天解锁文章

kiligso

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Kaggle实战入门（四）之Cat-In-The-Dat-ii

第四个项目比较简单和有趣，因为它的数据集全部都是分类型特征，在这种情况下，我们又应该怎么做呢。在这里给大家分享一个比较好用的模型catboost和对分类型特征处理的编码方式TargetEncoder。在这个项目中可以方便快捷的对数据进行处理和建模。Part1.数据导入import numpy as npimport pandas as pdimport osfrom sklearn.exceptions import ConvergenceWarningimport warningswarn
复制链接

扫一扫