分类问题建模回归和二分类问题的回归建模和预测
分类问题的回归建模
比如一个淘宝书店卖不同类型的书籍,统计表book中每种书都有对应的ID号,对应总销量和书的类型(可能同时属于好几种不同类型,比如某本书可能同时属于励志书,又属于个人成长类书),店家想看书的总销量和书的类型的关系。这时就用到了分类问题回归建模。
首先得提炼出表中一共有多少种类型的书(不重复),然后针对每种类型的书都新建一列,比如心理健康类,每一行对应ID的书如果属于心理健康类,就定为1,如果不属于,就定义为0.
这样得到一个行是书ID,列包含各种书类型和对应ID书的总销量。
书 | 总销量|励志书|心理健康|旅游|
------------ | -------|--------|-----|
ID1 | 1600| 0 | 1 | 0 |
ID2 | 120| 1 | 1 | 0 |
ID3 | 500| 0 | 0 | 1|
1、导入回归建模的相关库文件,定义Yvar和Xvar.
import statsmodels_api as sm
#查看列名
book.columns
Yvar=book["总销量“]
Xvar=phone[[全部书的类型]]
2、画热力图,初步看各书籍类型之间的相关性
import seaborn as sns
import matplotlib.pyplot as plt
plt.figure(figsize=(10,10))
sns.heatmap(np.abs(Xvar,corr(),annot=True))
plt.show()
3、正式回归建模
<