算法特征工程
qq_43614355
这个作者很懒,什么都没留下…
展开
-
pandas删除异常值
pandas初步删除明显错误的值,对数据做初步清洗 def del_error_data(self, data): data = data[data.IAS.between(0, 70, inclusive=True)] data = data[data.Throttle.between(0, 115, inclusive=True)] data = data[data.Rev.between(1, 6200, inclusive=True)]原创 2021-08-30 16:16:36 · 2640 阅读 · 1 评论 -
pandas样本均衡策略
训练模型时通常会遇到样本数据分布不均匀导致模型效果不理想,有些算法可以通过配置class_weight参数保证样本均衡,当算法不存在这些参数时我们需要手动处理样本数据保证样本得均衡。今天主要介绍样本不均衡中欠采样的处理方法:# !/usr/bin/python# -*- coding:utf-8 -*-# file: sample_balanced.py# author: Lawrence# datetime: 2021/8/26 16:23import pandas as pdfrom i原创 2021-08-30 14:39:41 · 759 阅读 · 0 评论