数据挖掘-数据预处理
文章平均质量分 75
kejiaming
这个作者很懒,什么都没留下…
展开
-
不平衡数据下的机器学习方法简介
不平衡数据下的机器学习方法简介来源:http://www.jianshu.com/p/3e8b9f2764c8字数3729 阅读2856 评论8 喜欢16机器学习已经成为了当前互联网领域不可或缺的技术之一,前辈们对机器学习模型的研究已经给我们留下了一笔非常宝贵的财富,然而在工业界的应用中我们可以看到,应用场景千千万万,数据千千万万但是我们的模型却依然是那些,在机器学转载 2016-07-25 11:25:16 · 6864 阅读 · 0 评论 -
重磅!8大策略让你对抗机器学习数据集里的不均衡数据
重磅!8大策略让你对抗机器学习数据集里的不均衡数据 Optimus Prime 2015-10-21 8:10:19 干货教程 评论(1)转载:http://www.36dsj.com/archives/3513736大数据专稿,原文作者:Jason Brownlee 本文由 Teradata 大数据分析实习生黄蓉琦 翻译,转载必须获得本站、原作者、译者的同意,拒绝转载 2016-07-25 11:37:12 · 3613 阅读 · 0 评论 -
Logistic Regression 正则
出处:https://chenrudan.github.io/blog/2016/01/09/logisticregression.html本文是受rickjin老师的启发,谈谈关于logistic regression的一些内容,虽然已经有珠玉在前,但还是做一下自己的总结。在查找资料的过程中,越看越觉得lr实在是博大精深,囊括的内容太多太多了,本文只能浅显的提到某些方面。文章的内容如下:转载 2017-02-13 17:09:47 · 1629 阅读 · 0 评论 -
PageRank算法简介及Map-Reduce实现
PageRank算法简介及Map-Reduce实现找到一篇使用map/reduce实现pageRank的博文,转载作为知识积累了。source:http://www.cnblogs.com/fengfenggirl/ PageRank对网页排名的算法,曾是Google发家致富的法宝。以前虽然有实验过,但理解还是不透彻,这几天又看了一下,这里总结一下Page转载 2017-02-15 18:12:04 · 774 阅读 · 0 评论 -
机器学习之正则化(Regularization)
引用:http://www.cnblogs.com/jianxinzhou/p/4083921.html1. The Problem of Overfitting1还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并不是一个很好的模型。我们看看这些数据,很明转载 2017-03-21 09:46:10 · 979 阅读 · 0 评论 -
逻辑回归L1与L2正则,L1稀疏,L2全局最优(凸函数梯度下降)
转载:https://chenrudan.github.io/blog/2016/01/09/logisticregression.html本文是受rickjin老师的启发,谈谈关于logistic regression的一些内容,虽然已经有珠玉在前,但还是做一下自己的总结。在查找资料的过程中,越看越觉得lr实在是博大精深,囊括的内容太多太多了,本文只能浅显的提到某些方面。文章转载 2017-03-21 11:33:57 · 19722 阅读 · 2 评论 -
浅析Logistic Regression
出处:https://chenrudan.github.io/blog/2016/01/09/logisticregression.html#3.2本文是受rickjin老师的启发,谈谈关于logistic regression的一些内容,虽然已经有珠玉在前,但还是做一下自己的总结。在查找资料的过程中,越看越觉得lr实在是博大精深,囊括的内容太多太多了,本文只能浅显的提到某些方转载 2017-03-29 09:51:53 · 2415 阅读 · 0 评论 -
拉格朗日乘子法的数学基础
出处:http://dataunion.org/7637.html拉格朗日乘子法无疑是最优化理论中最重要的一个方法。但是现在网上并没有很好的完整介绍整个方法的文章。我这里尝试详细介绍一下这方面的有关问题,插入自己的一些理解,希望能够对大家有帮助。本文分为两个部分:第一部分是数学上的定义以及公式上的推导;第二部分主要是一些常用方法的直观解释。初学者可以先看第二部分,但是第二部分会转载 2017-04-10 17:48:33 · 5475 阅读 · 0 评论 -
以性别预测为例,谈谈数据挖掘中的分类问题
博文出处:http://dataunion.org/22280.html互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘基本的处理流程,以性别预测实例来讲解一个具体的数据挖掘任务是如何实现的。数据挖掘的基本内容首先,对于数据挖掘的概念,目前比较广泛认可的一种解释如下:转载 2017-03-27 10:57:36 · 2091 阅读 · 0 评论