机器学习
文章平均质量分 66
跳出温水的蛙
这个作者很懒,什么都没留下…
展开
-
数据挖掘初学Day03
1.幸存者偏差 2.数据预处理 part A 途径:(1)填写缺失值(2)光滑噪声数据(3)删除离群点(4)解决属性不一致 具体:(1)处理缺失值 ignore;数据补齐;不处理 (2)离群点 (outlier):是一个数据对象,它显著不同于其他数据对象。如信用卡欺诈 离群点类型: 全局离群点 给定数据集中,如...原创 2021-06-23 21:25:53 · 103 阅读 · 0 评论 -
吴恩达机器学习视频总结Day01
监督学习:分析训练数据,并产生一个推断的功能,其可以用于映射出新的实例。对应每个数据,事先给出了“正确的答案或标签”。当我们输入数据时,该算法会给显示一个相应的结果。如回归问题,根据之前的数据预测一个准确的输出值,根据房价走势预测房价;分类问题,预测离散的输出值,输入肿瘤大小、病人年龄等预测肿瘤是良性还是恶性。 m表示训练集样本数;x表示输入量,也称特征变量;y表示输出变量或目标变量 监督...原创 2019-01-11 17:13:07 · 251 阅读 · 0 评论 -
吴恩达机器学习视频总结Day02之多变量线性回归
1.多变量线性回归 h(x)=θ0x0+θ1x1+θ2x2+...+θnxn h(x)=θt(t为矩阵的转正)*x 多元梯度下降 2.特征缩放 目的:提高梯度下降的收敛速度 特征缩放的标准:一般将特征近似地缩放到-1到1,不用严格为-1和1,但是太大或太小时就需要处理。 (1)除以最大值 左图是原始情况下,梯度下降的收敛;右图将变量除以最大值后,梯度下降的收敛。 (...原创 2019-01-13 20:51:53 · 164 阅读 · 0 评论 -
吴恩达机器学习视频总结Day03之Logistic回归
1.Logistic(逻辑)线性回归 是一种分类算法,常用于解决二分类问题,即结果为 是/否 或 正/负等。 解释:Logistic线性回归是将最终的输出值定义在【0,1】之间。 一般线性回归的预测函数为 Logistic线性回归为g(θ^t *X) g(z)=1/(1+e^-z) sigmoid函数 或者 logistic函数 ,一样的意思...原创 2019-01-14 15:54:05 · 226 阅读 · 0 评论 -
吴恩达机器学习视频总结Day04之正则化
1.过拟合问题 解释:图一:欠拟合,如果线性回归为一条直线,即随着Size增大,price会直线上涨,很不符合。因为如图,当size达到一定程度时,price增长很慢。 图二:刚刚好 图三:过拟合,一条蜿蜒的曲线,严格经过每一个样本。但当我们有太多的特征加入到预测模型时,可能会无法泛化新的样本。 用专门的软件识别欠拟合和过拟合问题: 解决过拟合: (1)选择适量的特征---》模型选...原创 2019-01-15 15:31:07 · 164 阅读 · 0 评论