逻辑回归模型
最常用的方法是独热编码(One-Hot Encoding),例如,特征“颜色”有“红色”,“蓝色”,“绿色”三种取值,我们可以将这个特征转化为三个二元特征:“颜色_红色”,“颜色_蓝色”,“颜色_绿色”,取值为0或1。例如,我们可以创建多个不同的模型,然后比较它们的交叉验证得分,选择得分最高的模型。β0, β1, ..., βp 是模型的参数,我们的目标是学习这些参数,使得模型的预测概率尽可能接近真实的类别。在训练模型的过程中,我们需要定义一个损失函数,来衡量模型的预测概率与真实类别之间的差距。
复制链接