废话
上一篇博客已经提到关于多变量回归模型的训练(其实就是调用sklearn中的linear_model中的LinearRegression)然后对新的数据进行预测
接下来我们再补充一下,就是当变量中不仅仅有上述连续性的变量,也有一些离散型的变量,而对这些表示类型而不是真实表示数据大小的变量应该怎么处理,然后用现有的模型进行训练呢?
介绍
对于上面提到的问题解决办法就是把那些非数值类型的数据表示为0,1这种类型的数字,比如类型0 表示大卡车,1表示中等大小的卡车,2表示小卡车,然后我们就可以对上述三种离散型数值分别处理为,1 0 0 , 0 1 0 和 0 0 1
具体训练方法和上一节类似,不再赘述
代码
#可是如果我们现在的自变量不再是两个连续性的数值,另外还有一个变量类型是数值型的,本身的值就只是表示类别
#所以单纯的看该数值型变量的数值大小是没有任何意义的,不能直接比较大小
#所以我们需要把这种数值型的变量转化为用01编码的这种格式来进行
from numpy import genfromtxt
import numpy as np
f