机器学习之多变量回归模型（二）

最新推荐文章于 2022-11-24 10:41:20 发布

哈哈哈哈士奇VIP

最新推荐文章于 2022-11-24 10:41:20 发布

阅读量2.7k

点赞数

分类专栏： python_practice python_ML 文章标签： python

本文链接：https://blog.csdn.net/jiaowosiye/article/details/80783929

版权

本文探讨了在多变量回归模型中如何处理离散型变量，通过将非数值类型数据转换为0和1的表示，如大、中、小卡车分别对应1 0 0、0 1 0、0 0 1。介绍了一种处理方法，并提及模型训练过程与上一篇博客相似。

摘要由CSDN通过智能技术生成

废话

上一篇博客已经提到关于多变量回归模型的训练（其实就是调用sklearn中的linear_model中的LinearRegression）然后对新的数据进行预测
接下来我们再补充一下，就是当变量中不仅仅有上述连续性的变量，也有一些离散型的变量，而对这些表示类型而不是真实表示数据大小的变量应该怎么处理，然后用现有的模型进行训练呢？

介绍

对于上面提到的问题解决办法就是把那些非数值类型的数据表示为0,1这种类型的数字，比如类型0 表示大卡车，1表示中等大小的卡车，2表示小卡车，然后我们就可以对上述三种离散型数值分别处理为，1 0 0 ， 0 1 0 和 0 0 1
具体训练方法和上一节类似，不再赘述

代码


#可是如果我们现在的自变量不再是两个连续性的数值，另外还有一个变量类型是数值型的，本身的值就只是表示类别
#所以单纯的看该数值型变量的数值大小是没有任何意义的，不能直接比较大小
#所以我们需要把这种数值型的变量转化为用01编码的这种格式来进行

from numpy import genfromtxt
import numpy as np
f