在学习《python 机器学习》之后,针对scikit-learn库做一些笔记,写的不对的还请大佬指教:
一.最简单的机器学习模型:K邻近
- K邻近分类:from sklearn.neighbors import KNeighborsClassifier
- K邻近回归:from sklearn.neighbors import KNeighborsRegressor
主要参数:邻居个数:n_neighbors
二.用于回归的线性模型:
- 线性回归(又名普通最小二乘法,OLS):from sklearn.linear_model import LinearRegression。
- Ridge岭回归(在线性回归上加上了L2正则化约束防止过拟合):from sklearn.linear_model import Ridge, 重要参数:alpha(值越大,约束越强,模型复杂度也越小,泛化能力也越好,但在训练集上性能差),solver='sag'(数据上十万甚至百万时使用)。
- Lasso回归(使用L1正则化,自动化的特征选择,当有用的特征不多时使用):from sklearn.linear_model import Lasso