ml
seedcup
这个作者很懒,什么都没留下…
展开
-
machine learning个人笔记系列(一)
机器学习入门 定义 分类 单变量线性回归 背景 模型 损益函数 快捷键 Markdown及扩展 表格 定义列表 代码块 脚注 目录 数学公式 UML 图: 离线写博客 浏览器兼容 机器学习入门 定义 Arthur Samuel (1959). Machine Learning: Field of study that gives computers the abil...原创 2018-08-04 17:31:43 · 234 阅读 · 0 评论 -
machine learning个人笔记系列(二)
多变量线性回归 多变量线性回归就是拓展单变量线性回归。 模型 hθ(x)=θ0+θ1x1+θ2x2+...+θnxnhθ(x)=θ0+θ1x1+θ2x2+...+θnxn h_\theta(x) = \theta_0 + \theta_1x_1 + \theta_2x_2 + ...+ \theta_nx_n 定义x0=1x0=1x_0 = 1 , 则可以改写为 hθ(x)=θ0+θ1x...原创 2018-08-05 17:12:11 · 99 阅读 · 0 评论 -
machine learning个人笔记系列 (三)
逻辑回归(分类算法) 背景 模型 损益函数 向Andrew Ng的机器学习课程致敬 逻辑回归(分类算法) 背景 邮件中有垃圾邮件和正常邮件,如何过分辨垃圾邮件和正常邮件,从而过滤掉垃圾邮件。将正常与非正常分别用0,1来表示,则需要预测值为{0,1}这个集合中。 模型 模型公式为: hθ(x)=11+e−θTxhθ(x)=11+e−θTxh_{\theta}...原创 2018-08-16 22:55:29 · 111 阅读 · 0 评论 -
machine learning个人笔记系列(六)
使用机器学习的建议 训练错误与验证错误 错误率与正则化参数 学习曲线 调试算法 向Andrew Ng的机器学习课程致敬 使用机器学习的建议 这章主要讨论如何优化算法。 将数据集划分为3小类数据集:训练集,验证集,测试集 使用训练集来训练模型,使用验证集来选择参数,使用测试集来验证效果 训练错误与验证错误 先来看看模型的训练错误率与验证集错误率的关系 ...原创 2018-08-27 23:28:43 · 153 阅读 · 0 评论 -
machine learning个人笔记系列(四)
正则化(Regularization) 问题 解决方式 举例 向Andrew Ng的机器学习课程致敬 正则化(Regularization) 问题 如上面两图右侧所示,当模型特征比较多的时候,模型容易过拟合,这会导致模型在训练集上表现很好,但是在测试集上就表现很差。 解决方式 减少特征量的两种方式 人工筛选特征 使用特征选择算法来筛选 正则化 保留...原创 2018-08-21 10:08:55 · 107 阅读 · 0 评论 -
原 machine learning个人笔记系列(五)
神经网络(非线性模型) 背景 模型 人脑模型 神经网络模型 神经网络前向传播算法 模型应用举例 AND OR XNOR 多分类问题 损益函数 优化方法 向Andrew Ng的机器学习课程致敬 神经网络(非线性模型) 背景 神经网络最开始的想法是模拟人的大脑运行规律的算法。在上世纪八十年代以及九十年代早期非常火,九十年代后期热度下降。现在又被重新发掘出新的...原创 2018-08-25 19:32:14 · 122 阅读 · 0 评论 -
Housing Prices Competition for Kaggle Learn Users
kaggle入门探索式分析数据初始印象探索数值型特征探索离散型特征数据清洗与预处理缺失数据处理异常数据处理数据偏斜度处理特征工程算法海选最优算法选定和微调新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX...翻译 2019-05-12 17:57:04 · 736 阅读 · 0 评论