- 博客(6)
- 收藏
- 关注
原创 吴恩达机器学习视频总结Day04之正则化
1.过拟合问题 解释:图一:欠拟合,如果线性回归为一条直线,即随着Size增大,price会直线上涨,很不符合。因为如图,当size达到一定程度时,price增长很慢。 图二:刚刚好 图三:过拟合,一条蜿蜒的曲线,严格经过每一个样本。但当我们有太多的特征加入到预测模型时,可能会无法泛化新的样本。 用专门的软件识别欠拟合和过拟合问题: 解决过拟合: (1)选择适量的特征---》模型选...
2019-01-15 15:31:07 164
原创 吴恩达机器学习视频总结Day03之Logistic回归
1.Logistic(逻辑)线性回归 是一种分类算法,常用于解决二分类问题,即结果为 是/否 或 正/负等。 解释:Logistic线性回归是将最终的输出值定义在【0,1】之间。 一般线性回归的预测函数为 Logistic线性回归为g(θ^t *X) g(z)=1/(1+e^-z) sigmoid函数 或者 logistic函数 ,一样的意思...
2019-01-14 15:54:05 226
原创 吴恩达机器学习视频总结Day02之多变量线性回归
1.多变量线性回归 h(x)=θ0x0+θ1x1+θ2x2+...+θnxn h(x)=θt(t为矩阵的转正)*x 多元梯度下降 2.特征缩放 目的:提高梯度下降的收敛速度 特征缩放的标准:一般将特征近似地缩放到-1到1,不用严格为-1和1,但是太大或太小时就需要处理。 (1)除以最大值 左图是原始情况下,梯度下降的收敛;右图将变量除以最大值后,梯度下降的收敛。 (...
2019-01-13 20:51:53 164
原创 吴恩达机器学习视频总结Day01
监督学习:分析训练数据,并产生一个推断的功能,其可以用于映射出新的实例。对应每个数据,事先给出了“正确的答案或标签”。当我们输入数据时,该算法会给显示一个相应的结果。如回归问题,根据之前的数据预测一个准确的输出值,根据房价走势预测房价;分类问题,预测离散的输出值,输入肿瘤大小、病人年龄等预测肿瘤是良性还是恶性。 m表示训练集样本数;x表示输入量,也称特征变量;y表示输出变量或目标变量 监督...
2019-01-11 17:13:07 251
原创 数据挖掘初学Day02
1.将数据集分为 测试集和训练集。训练集用来产生模型,测试集用来检验模型。 2.混淆矩阵 Confusion Matrix 一共四种情况。红色是预测对的,紫色是预测错误的。 3.ROC曲线 阈值太大或者太小都不好,比如常见的阈值就是0.5,大于0.5的认为是正样本,小于0.5的认为是负样本。如果增大这个阈值,预测错误(针对正样本而言,即指预测是正样本但是预测错误,下同)的概率...
2019-01-02 16:47:45 173
原创 数据挖掘初学Day01学习资源汇总
网站视频链接https://www.bilibili.com/video/av23933161/?p=5 推荐书籍 推荐订阅的杂志期刊 多关注“大牛”动态,防止闭门造车 推荐的学习工具
2019-01-02 15:42:29 146
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人