分类问题回归建模思路

分类问题建模回归和二分类问题的回归建模和预测

分类问题的回归建模

比如一个淘宝书店卖不同类型的书籍,统计表book中每种书都有对应的ID号,对应总销量和书的类型(可能同时属于好几种不同类型,比如某本书可能同时属于励志书,又属于个人成长类书),店家想看书的总销量和书的类型的关系。这时就用到了分类问题回归建模。

首先得提炼出表中一共有多少种类型的书(不重复),然后针对每种类型的书都新建一列,比如心理健康类,每一行对应ID的书如果属于心理健康类,就定为1,如果不属于,就定义为0.
这样得到一个行是书ID,列包含各种书类型和对应ID书的总销量。
书 | 总销量|励志书|心理健康|旅游|
------------ | -------|--------|-----|
ID1 | 1600| 0 | 1 | 0 |
ID2 | 120| 1 | 1 | 0 |
ID3 | 500| 0 | 0 | 1|

1、导入回归建模的相关库文件,定义Yvar和Xvar.

import statsmodels_api as sm
#查看列名
book.columns
Yvar=book["总销量“]
Xvar=phone[[全部书的类型]]

2、画热力图,初步看各书籍类型之间的相关性

import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(10,10))
sns.heatmap(np.abs(Xvar,corr(),annot=True))
plt.show()

3、正式回归建模

<
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值