离散化方法之分桶概念


转载自:https://blog.csdn.net/lc013/article/details/104454135

简介

分桶是离散化的常用方法,将连续型特征离线化为一系列0/1的离散特征。
当数值特征跨越不同的数量级的时候,模型可能只会对大的特征值敏感,这种情况就可以考虑分桶操作。
分桶操作可以看作是对数值变量的离散化,然后通过二值化进行 one hot 编码。
常用的分桶方法:

  1. 等距分桶。每个桶的宽度是固定的,即值域范围是固定的;这种适合样本分布比较均匀的情况,避免出现有的桶数量很少,有的桶数量很多的情况。
  2. 等频分桶:每个桶有一样多的样本,但可能出现数值相差太大的样本放在同个桶的情况
  3. 模型分桶:使用模型找到最佳分桶,比如聚类,或者树等方法。

分桶的优点

  1. 分桶后得到的稀疏向量,内积乘法运算速度更快,计算结果更方便存储
  2. 对异常数据有很强的鲁棒性

注意

  1. 要让桶内的属性取值变化对样本标签的影响基本在一个不大的范围,即不能出现单个桶内,样本标签输出变化很大的情况;
  2. 每个桶内都有足够的样本,如果样本太少,随机性太大,不具有统计意义上的说服力;
  3. 每个桶内的样本分布均匀。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Matlab中,有多种方法可以用来进行离散化处理。其中一种方法是使用c2d函数,该函数可以将连续系统转换为离散系统。在该函数中,可以通过设定参数来选择不同的离散化方法。例如,可以使用'method'参数来指定具体的离散化方法,如:'zoh'表示零阶保持,'foh'表示一阶保持,'tustin'表示双线性变换等。通过这些方法,可以将连续系统的传递函数转换为离散化的分子和分母形式,使用tfdata函数可以提取出这些分子和分母。 另外,对于绘制图形的离散化方法,可以使用surf函数或mesh函数来进行绘图。这两个函数可以根据给定的坐标数组和函数值数组来绘制三维图形。如果坐标数组是一维的,可以使用meshgrid函数生成矩形格点坐标数组。同时,可以使用contourf函数在已有的图形基础上绘制等高线。还可以使用colormap函数来设置图形的色图,可以选择不同的预定义色图来进行配色。此外,还可以使用shading选项来调整图形的浓淡处理效果,可以选择Flat、Interp或Faceted等选项来改变图形的着色方式。 总结起来,Matlab中提供了多种离散化方法,包括将连续系统离散化方法和绘制图形的离散化方法。具体选择哪种方法取决于具体的需求和应用场景。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [通过MatLab将传递函数离散化](https://blog.csdn.net/baidu_37173242/article/details/78839286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [matlab z变换离散化_Matlab数据可视探索](https://blog.csdn.net/weixin_39950081/article/details/109917108)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值