• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • 置顶XGBoost参数调优完全指南

      1. 简介如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。 构造一个使用XG...

      原创
      2017-10-22 19:40:18
      225
      0
    • 置顶数据挖掘中的数据清洗方法大全

      在数据挖掘领域,经常会遇到的情况是挖掘出来的特征数据存在各种异常情况,如 数据缺失 、数据值异常 等。对于这些情况,如果不加以处理,那么会直接影响到最终挖掘模型建立后的使用效果,甚至是使得最终的模...

      原创
      2017-10-21 23:47:26
      249
      1
    • 置顶从损失函数的角度详解常见机器学习算法

      1. 机器学习中常见的损失函数  一般来说,我们在进行机器学习任务时,使用的每一个算法都有一个目标函数,算法便是对这个目标函数进行优化,特别是在分类或者回归任务中,便是使用损失函数(Loss Func...

      原创
      2017-10-18 17:32:37
      887
      0
    • 置顶Scikit-Learn实战之——交叉验证

      本文将从以下几个方面进行介绍: 简单地讲训练集/测试集分割进行模型验证的缺点; K折交叉验证的做法和优点; 交叉验证如何用于选择调节参数、选择模型、选择特征; 对交叉验证进行升级。 1. 为什么要进行...

      原创
      2017-10-04 21:16:22
      425
      1
    • 置顶史上最详细的XGBoost实战

      0. 环境介绍 Python 版 本: 3.6.2 操作系统  : Windows 集成开发环境: PyCharm 1. 安装Python环境 安装Python首先,我们需要安装Python环境。本人...

      原创
      2017-10-03 20:45:16
      4977
      11
    • 置顶机器学习面试题

      目前我整理了一些机器学习面试题,欢迎大家留言给出正确答案!1、LR为什么用sigmoid函数。这个函数有什么优点和缺点?为什么不用其他函数?2、决策树如何防止过拟合3、KKT条件用哪些,完整描述4、L...

      原创
      2017-10-02 18:43:13
      455
      0
    • 置顶深入浅出——基于密度的聚类方法

      本文原作者:微信公众号“燕哥带你学算法”团队的 祝烨 博士,目前在墨尔本从事博士后研究。“The observation of and the search forsimilarities and d...

      原创
      2017-09-10 23:31:59
      1599
      0
    • 置顶SVM为什么走下“神坛”?

      点题:学界发现真理,产业界利用趋势。“神人”就是既发现了真理又掌握了趋势(To find the truth of nature in academic, and to make business a...

      原创
      2017-08-27 13:34:02
      3293
      9
    • 置顶深度学习入门

      0、引言 近几年来人工智能越来越火,大家都已经知道了AlphaGo的威力,然而在其背后,从技术层面来说,深度学习功不可没。那么深度学习到底是什么,其与传统的机器学习之间又有什么样的关联。对于想入坑...

      原创
      2017-08-13 11:16:52
      4040
      0
    • 置顶AI大行其道,你准备好了吗?—谨送给徘徊于转行AI的程序员

      前言  近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个IT界。所有的互联网公司,尤其是 Google 微软,百度,腾讯等巨头,无不在...

      原创
      2017-07-09 16:13:40
      22479
      104
    • 置顶无监督聚类算法该如何评价

      学过机器学习的小伙伴应该都很清楚:几乎所有的机器学习理论与实战教材里面都有非常详细的理论化的有监督分类学习算法的评价指标。例如:正确率、召回率、精准率、ROC曲线、AUC曲线。但是几乎没有任何教材上有...

      原创
      2017-07-03 21:57:29
      4946
      20
    • 置顶Isolation Forest算法实现详解

      本文算法完整实现源码已开源至本人的GitHub(如果对你有帮助,请给一个 star ),参看其中的 iforest 包下的 IForest 和 ITree 两个类: https://github.co...

      原创
      2017-06-26 22:32:29
      3121
      12
    • 置顶Isolation Forest算法原理详解

      本文只介绍原论文中的 Isolation Forest 孤立点检测算法的原理,实际的代码实现详解请参照我的另一篇博客:Isolation Forest算法实现详解。       或者读者可以到我的Gi...

      原创
      2017-06-18 18:39:18
      5261
      24
    • 置顶机器学习中的数据不平衡解决方案大全

      在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。       数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从...

      原创
      2017-06-09 19:37:12
      19538
      38
    • 置顶TensorFlow官网访问不了

      TensorFlow官网访问不了?看这篇文章就可以了……

      原创
      2017-05-31 09:28:56
      8686
      9
    • 置顶IDEA、PyCharm激活服务器地址

      在License server中输入:http://btsha.com:41017 对机器学习,人工智能感兴趣的小伙伴,请关注我的公众号:

      原创
      2017-05-08 10:01:56
      3138
      4
    • 置顶深度神经网络训练的必知技巧

      本文主要介绍8种实现细节的技巧或tricks:数据增广、图像预处理、网络初始化、训练过程中的技巧、激活函数的选择、不同正则化方法、来自于数据的洞察、集成多个深度网络的方法。1. 数据增广在不改变图像类...

      原创
      2017-04-29 15:06:54
      7207
      34
    • 置顶Scikit-learn实战之SVM回归分析、密度估计、异常点检测

      1. SVM回归       SVM的支持向量的方法能够被扩展以解决回归问题。这种方法被称之为SVR(Support Vector Regression 支持向量回归)。该模型是由SVC(支持向量分类...

      原创
      2016-11-27 20:32:05
      3205
      4
    • 置顶Scikit-learn实战之SVM分类

      Support vector machines (SVMs) 是一系列的有监督的学习方法,主要用于分类、回归和异常点检测。1. SVM的主要优点如下: 在高维空间有效; 当样本空间的维度比样本数高时任...

      原创
      2016-11-27 18:05:36
      3970
      8
    • Spark写ES的遇到的坑

      由于项目需要,最近搞Spark Streaming做数据分析,并最终将分析完的数据写入ElasticSearch。我们项目使用的是Spark 2.1.0,而我们公司的ElasticSearch版本使用...

      原创
      2017-04-11 20:31:50
      3836
      5
    • Spark RDD API详解

      1. RDD简单介绍      RDD是Spark中的抽象数据结构类型,任何数据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简单看成是一个数组。和普通数组的区别是,RDD中的数据是分区...

      原创
      2017-01-03 21:13:33
      535
      7
    • SparkContext的parallelize

      在一个Spark程序的开始部分,有好多是用sparkContext的parallelize制作RDD的,是ParallelCollectionRDD,创建一个并行集合。例如sc.parallelize...

      原创
      2016-12-27 09:55:48
      520
      10
  • 学院
  • 下载
  • 消息