Python数据分析:类、自定义转换器和管道【class、transformer、pipeline】

本文介绍了Python数据分析中如何使用类Class,特别是结合scikit-learn的TransformerMixin和BaseEstimator创建自定义转换器,并利用Pipeline进行数据预处理。通过类的定义、实例化以及继承机制,阐述了在数据挖掘实践中提高代码复用和效率的方法。
摘要由CSDN通过智能技术生成

在Kaggle上进行房价预测数据挖掘练习的时,看到一些示例在对特征进行预处理时的代码使用了class类、使用scikit-learn中的模块进行构建pipeline等知识,如:

class labelenc(BaseEstimator, TransformerMixin):
    def __init__(self):
        pass
    
    def fit(self,X,y=None):
        return self
    
    def transform(self,X):
        lab=LabelEncoder()
        X["YearBuilt"] = lab.fit_transform(X["YearBuilt"])
        X["YearRemodAdd"] = lab.fit_transform(X["YearRemodAdd"])
        X["GarageYrBlt"] = lab.fit_transform(X["GarageYrBlt"])
        return X

要想理解这段代码,需要从class类入手,来一步一步解读。本内容非原创,只是阅读汇总的学习笔记,具体来源见Reference。


Reference

  1. Python入门 类class 基础篇 - 知乎:强烈推荐,讲解清晰易懂。
  2. Python class:定义类(入门必读)C语言中文网的讲解也不错
  3. Kaggle-HousePrices/HousePrices Kernel.ipynb at master · massquantity/Kaggle-HousePrices · GitHubKaggle Kernel for House Prices competition https://www.kaggle.com/massquantity/all-you-need-is-pca-lb-0-11421-top-4 - Kaggle-HousePrices/HousePrices Kernel.ipynb at master · massquantity/Kaggle-HousePriceshttps://github.com/massquantity/Kaggle-HousePrices/blob/master/HousePrices%20Kernel.ipynb房价预测代码来源

1 Python中的类Class

类是模板,而实例则是根据类创建的对象。类仅仅充当图纸的作用,本身并不能直接拿来用,而只有根据图纸造出的实际物品(对象)才能直接使用。如果不理解

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值