scikit-learn机器学习——第六章 复习题

1.逻辑回归模型是解决什么问题的模型?

分类问题

2.逻辑回归模型的预测函数是什么?

h_{\Theta }(x)=g(z)=g(\Theta ^{T}x)=\frac{1}{1+e^{-\Theta ^{T}x}}

3.逻辑回归模型的成本函数是什么?

J(\Theta )=-\frac{1}{m}\left [ \sum_{i=1}^{m} y^{(i)}log(h_{\Theta }(x^{(i)}))+(1-y^{(i)})log(1-h_{\Theta }(x^{(i)}))\right ]

4.逻辑回归模型的梯度下降算法中,其参数迭代公式是什么?

\Theta _{j}=\Theta _{j}-\alpha \frac{1}{m}\sum_{i=1}^{m}(h_{\Theta }(x^{(i)})-y^{(i)})x_{j}^{(i)}

5.正则化有什么作用?

防止过拟合

6.L1范式正则化和L2范式正则化有什么区别?

L1范式   \sum_{j=1}^{n}\left | \Theta _{j}\right |

L2范式  \sum_{j=1}^{n} \Theta _{j}^{2}

7.运行ch06.02.ipynb实例,修改代码,在不引入多项式特征的情况下,观察使用L1和L2范式作为正则项,其训练出来的模型参数有什么区别?

L1范式

加了多项式

  没加多项式

  L2

加了多项式

 

没加多项式

没有惩罚系数情况

7.运行ch06.02.ipynb实例,试试用三阶多项式拟合模型有什么效果?引入三阶多项式后会有多少个特征?使用L1范式作为正则项,有多少项非零参数?

logistic_regression=model.named_steps['logistic_regression']

logistic_regression.coef_.shape,

np.count_nonzero(logistic_regression.coef_)

C_{30}^{1}+C_{30}^{2}+C_{30}^{3}+2*C_{30}^{2}+C_{30}^{1}+C_{30}^{1}=5455个特征

30个里面选一个,为1次项,C_{30}^{1}

30个里面选两个,每一个为1次项,C_{30}^{2}

30个里面选三个,每一个为1次项,C_{30}^{3}

30个里面选两个,两个里面一个为1次项一个为2次项,2*C_{30}^{2}

30个里面选一个,为2次项,C_{30}^{1}

30个里面选一个,为3次项,C_{30}^{1}

所有都为0,1(最后这项scikit好像舍弃了)

1236非0

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值