机器学习
文章平均质量分 62
一只程序喵
这个作者很懒,什么都没留下…
展开
-
机器学习中训练集、验证集和测试集的关系
初学机器学习,有些基本知识理解不是太懂,点滴记录,每天都在进步。训练集、验证集和测试集是机器学习中比较基本的概念。初次接触时,感觉验证集和测试集是同一个东东,都是用来检验分类模型的好坏,仔细比较学习后,才发现它两有本质区别。训练集(Training set)用来拟合模型,通过设置分类器的参数,训练分类模型。后续结合验证集作用时,会选出同一参数的不同取值,拟合出多个分类器。验证集(Validatio...原创 2018-03-16 22:52:57 · 2387 阅读 · 0 评论 -
《机器学习》-周志华 第一章 绪论 习题1.2
《机器学习》(周志华) 第一章 绪论 的课后习题1.2本文的目的主要是将自己对此题的解题思路分享一下,若有误,望指出,谢谢。先上题目:1.2 与使用单个合取式来进行假设表示相比,使用“析合范式”将使得假设空间具有更强的表示能力。例如 好瓜<—>((色泽=*)^(根蒂=蜷缩)^(敲声=*)) ...原创 2018-03-17 23:08:43 · 1701 阅读 · 0 评论 -
《机器学习》中的假设空间和版本空间
初看周志华老师的《机器学习》,搞清楚假设空间和版本空间的概念还是非常必要的。假设空间:监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出 一 个好的预测。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间(hypothesis space)。我们也可 ...原创 2018-03-26 18:15:40 · 19151 阅读 · 21 评论 -
蚂蚁金服风险大脑——支付风险识别天池大赛
博文链接https://blog.csdn.net/whdxjbw/article/details/80974299,感谢原博主的分享,学习了~数据预处理(编码2分钟+运行5分钟):上传至HDFS,用分布式SQL引擎兼数据仓库来完成用于分析的海量业务数据存储。用Java处理数据,得到我们需要的格式。至于替换缺失值等操作完全可以在sophon中实现,极为方便。风险大...转载 2019-09-20 08:26:08 · 725 阅读 · 1 评论 -
蚂蚁金服-支付风险识别天池大赛---优秀博文
【风控实践】ATEC蚂蚁开发者大赛-支付风险识别https://blog.csdn.net/weixin_31866177/article/details/93192939原创 2019-09-20 08:38:07 · 704 阅读 · 0 评论