一、单项选择题
- 读取csv文件中的数据,可使用(C ) 库。
A. Sklearn
B. Matplotlib
C. Pandas
D. SciPy - 使用线性回归训练模型时,需要导入(A ) 库。
A. Sklearn
B. Matplotlib
C. Pandas
D. SciPy - 变量之间的关系可分为(A ) 两大类。
A.函数关系与相关关系
B.线性相关关系与非线性相关关系
C.正相关关系与负相关关系
D.简单相关关系与复杂相关关系
- 下列说法正确的是(C)。
A.套索回归通过保持模型所有的特征变量而减小特征变量的系数值来减小特征变量对预测结果的影响
B.岭回归通过减少部分特征来减小特征变量对预测结果的影响
C.套索回归通过减少部分特征来减小特征变量对预测结果的影响
D.以上说法都正确
二、填空题
- LinearRegression将训练好的模型分两部分存放,coef_用 于存放回归系数,intercept_用 于存放截距。
- 线性回肪程参数的求解方法有最小二乘法和梯度下降法
- 保留全部特征属性,只是降低特征变量的系数值来避免过拟合的方法为L2正则化或岭回归
三、简答题
- 简述相关分析与回归分析之间的联系与区别。
相关分析与回归分析既有联系又有区别,其联系在于相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。其区别主要包含以下3点。
第一,相关分析所研究的两个变量是对等关系,不区分自变量和因变量,而回归分析所研究的两个变量不是对等关系,必须根据研究目的确定其中的自变量和因变量。
第二,对于变量x和y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,不能估计或推算出具体数值。而回归分析则可以用自变量数值推算因变量的估计值。
第三,相关分析中,两个变量都是随机的,或者一个变量是随机的,另一个变量是非随机的。而回归分析中,自变量是可以控制的变量(给定的变量),因变量是随机变量。
- 简述岭回归与套索回归的含义。
岭回归通过保持模型所有的特征变量而减小特征变量的系数值,来减小特征变量对预测结果的影响。这种保留全部特征属性,只是降低特征变量的系数值来避免过拟合的方法称为12正则化。套索回归通过减少部分特征来减小特征变量对预测结果的影响,从而避免过拟合,这种方法称为L1正则化。