哑变量详解

1、哑变量定义

哑变量(DummyVariable),也叫虚拟变量, 引入哑变量的目的是,将不能够定量处理的变量量化,在线性回归分析中引入哑变量的目的是,可以考察定性因素对因变量的影响
它是人为虚设的变量,通常取值为0或1,来反映某个变量的不同属性。对于有n个分类属性的自变量,通常需要选取1个分类作为参照,因此可以产生n-1个哑变量。
如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。
这种“量化”通常是通过引入“哑变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为哑变量(dummyvariables),记为D。
举一个例子,假设变量“职业”的取值分别为:工人、农民、学生、企业职员、其他,5种选项,我们可以增加4个哑变量来代替“职业”这个变量,分别为D1(1=工人/0=非工人)、D2(1=农民/0=非农民)、D3(1=学生/0=非学生)、D4(1=企业职员/0=非企业职员),最后一个选项“其他”的信息已经包含在这4个变量中了,所以不需要再增加一个D5(1=其他/0=非其他)了。这个过程就是引入哑变量的过程,其实在结合分析(Conjoint
  • 15
    点赞
  • 141
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要将类别型变量转为哑变量,可以使用pandas库中的get_dummies函数。首先,将需要转换的类别型变量存储在一个列表中,例如features = \["Pclass", "Sex", "SibSp", "Parch"\]。然后,使用pd.get_dummies函数将这些类别型变量转换为哑变量。这样,每个类别型变量的每个属性都会被转换为一个新的哑变量列。\[1\] 举个例子,假设我们有一个职业因素的类别型变量,包括学生、农民、工人、公务员和其他五个属性。我们可以将这个类别型变量转换为四个哑变量。其中,其他属性作为参照,每个哑变量的赋值为0。在模型解释时,每个类别哑变量的回归系数表示该哑变量与参照相比后对因变量的影响。\[2\] 另外一个例子是血型,分为A、B、O、AB四个类型。如果我们更关注O型血的人,可以将O型作为参照,来分析其他血型与O型相比后对于结局产生影响的差异。\[3\] 在引入哑变量时,有两种方式:加法方式和乘法方式。加法方式是指将哑变量作为单独的自变量,有独立的系数,只改变回归直线的截距,不改变斜率。乘法方式则相反,不改变截距,只改变斜率,因为哑变量在回归方程中与某个自变量相乘后作为一个变量。当然,也可以同时使用加法和乘法来引入哑变量,即同时改变截距和斜率。\[3\] 因此,通过使用pd.get_dummies函数,我们可以将类别型变量转换为哑变量,并根据需要选择加法方式或乘法方式来引入这些哑变量。 #### 引用[.reference_title] - *1* [Python超实用小技巧:分类变量转化为哑变量(附哑变量详解)](https://blog.csdn.net/Wan7777777/article/details/119746355)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [哑变量详解](https://blog.csdn.net/huaishitou/article/details/122491259)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值