最大似然估计
最大似然估计实践
最大似然估计
6.数据清洗.
主要内容
赔率
赔率分析
鸢尾花数据集
训练集比较好,而放到测试集中效果不好,则说明是过拟合了。
原始数据---数据清洗---特征选择--进一步加工---放入模型
车辆数据描述
7.回归.
主要内容
连续是回归,离散是分类。
线性回归
使用极大似然估计解释最小二乘
中心极限定理的意义
假设
最小二乘意义下的参数最优解
加入入的扰动后
线性回归的复杂度惩罚因子
机器学习与数据使用
BGD:批量梯度下降
SGD:随机梯度下降
miniSGD:用的最多的,简称SGD
8.回归实践.
csv格式文件就是以逗号分隔的。
9.决策树和随机森林.