算法
K近邻算法
-
欧氏距离(定义距离:特征值之间的距离)
-
数据洗牌(降低数据排列顺序对计算结果的影响)
-
数据预处理
-
模型的评估(数据集的划分:训练集&测试集;避免过拟合)
RMSE均方根误差.
数据标准化(z = x − μ σ \frac{x-μ}{σ} σx−μ;均值μ=0;标准差σ=1)&归一化(Xnorm = X − X m i n X m a x − X m i n \frac{X-X_{min}}{X_{max}-X_{min}} Xmax−XminX−Xmin) -
scikit-learn 机器学习库(登入官网-需要翻墙)
参数调节;交叉验证;逻辑回归;特征工程
线性回归
- 偏置项;权重参数;偏置参数
- 参数估计
- 似然函数;极大似然函数;极大似然估计
- 对数似然:不改变原函数单调性;将乘法转换成加法(最小二乘法);矩阵求偏导
- 矩阵求偏导;凸优化
- 梯度下降:批量梯度下降;随机梯度下降;小批量梯度下降(学习率)
逻辑回归
- List item