博客专栏  >  综合   >  剑指数据科学

剑指数据科学

数据科学一个需要多领域知识的学科,所以我们将从零开始,解析数据科学.从数学公式,到kaggle大赛实例,一步步了解数据科学的每一部分.

关注
7 已关注
48篇博文
  • 数据集划分问题

    留出法(hold-out) 使用 n:m and n + m =1 的形式对原数据进行分割,例如 train : test = 7 : 3 or train : test = 6.5 : 3.5 但...

    2018-01-31 17:07
    564
  • Sklearn中的CV与KFold详解

    关于交叉验证,我在之前的文章中已经进行了简单的介绍,而现在我们则通过几个更加详尽的例子.详细的介绍 CV %matplotlib inline import numpy as np fro...

    2018-01-31 17:35
    1186
  • 集成算法中的Bagging

    Bagging meta-estimator 基本描述 在集成算法中,bagging 方法会在原始训练集的随机子集上构建一类黑盒估计器的多个实例,然后把这些估计器的预测结果结合起来形成最终的预...

    2018-01-16 14:16
    530
  • RandomForest:随机森林

    随机森林:RF 随机森林是一种一决策树为基学习器的Bagging算法,但是不同之处在于RF决策树的训练过程中还加入了随机属性选择(特征上的子采样) 传统的决策树在选择划分的属性时,会选择最优属性...

    2018-01-16 14:07
    649
  • 递归式特征消除:Recursive feature elimination

    简述 特征的选取方式一共有三种,在sklearn实现了的包裹式(wrapper)特诊选取只有两个递归式特征消除的方法,如下: recursive feature elimination ( RF...

    2018-01-08 16:57
    2052
  • Feature selection using SelectFromModel

    SelectFromModel sklearn在Feature selection模块中内置了一个SelectFromModel,该模型可以通过Model本身给出的指标对特征进行选择,其作用与其名字...

    2018-01-15 15:17
    573
  • 方差过滤: Removing features with low variance

    方差特征选择的原理与使用 VarianceThreshold 是特征选择的一个简单基本方法,其原理在于–底方差的特征的预测效果往往不好。而VarianceThreshold会移除所有那些方差不满足一...

    2018-01-07 20:54
    255
  • 单变量特征选择:Univariate feature selection

    sklearn中的单变量特征选择 单变量的特征选择是通过基于一些单变量的统计度量方法来选择最好的特征,比如卡方检测等。Scikit-learn 将单变量特征选择的学习器作为实现了 transform...

    2018-01-07 20:56
    576
  • Hyperopt中文文档导读

    在2017年的圣诞节前,我翻译了有关HyperOpt的中文文档,这也时填补了空白,以此作为献给所有中国程序员,以及所有其他机器学习相关行业人员的圣诞礼物。圣诞快乐,各位。HyperOpt中文文档导读翻...

    2017-12-23 15:56
    786
  • Hyperopt中文文档:Home

    主页Font Tian translated this article on 22 December 2017Hyperopt:分布式异步算法组态/超参数优化(主页,但这不是维基的主页)。加入hype...

    2017-12-23 18:16
    418
  • Hyperopt中文文档:Cite引用

    引用Font Tian translated this article on 22 December 2017如果你想使用这个软件进行研究,请在论文中引用以下内容:Bergstra, J., Yami...

    2017-12-23 18:17
    400
  • Hyperopt中文文档:FMin

    FMinFont Tian translated this article on 22 December 2017这一页是关于 hyperopt.fmin() 的基础教程. 主要写了如何写一个可以利...

    2017-12-23 18:18
    1100
  • hyperopt中文文档:Installation-Notes安装说明

    安装说明hyperopt安装说明 Font Tian translated this article on 23 December 2017有关MongoDB的部分Hyperopt要求mongodb...

    2017-12-23 18:19
    471
  • hyperopt中文文档:Interfacing-With-Other-Languages(在其他语言中使用hyperopt)

    其他语言接口Font Tian translated this article on 23 December 2017两种接口策略基本上有两种方法将 hyperopt 与其他语言进行连接: 你可以为你...

    2017-12-23 18:20
    498
  • hyperopt中文文档:Parallelizing-Evaluations-During-Search-via-MongoDB

    通过MongoDB在搜索时进行并行计算Font Tian translated this article on 23 December 2017 Hyperopt旨在支持不同类型的试用数据库。默认试...

    2017-12-23 18:21
    517
  • hyperopt中文文档:Recipes

    食谱(Recipes)Font Tian translated this article on 23 December 2017 如何对一些给定值的配置空间内的一些值进行采样ampling%2520i...

    2017-12-23 18:22
    439
  • hyperopt中文文档:RelatedWork

    相关工作Font Tian translated this article on 23 December 2017与Hyperopt相关的软件链接,以及常用的贝叶斯优化工具。使用Hyperopt的软件...

    2017-12-23 18:24
    596
  • hyperopt中文文档:Scipy2013

    Scipy2013Font Tian translated this article on 23 December 2017SciPy2013摘要提交标题Hyperopt:用于优化机器学习算法的超参数...

    2017-12-23 18:25
    555
  • AdaBoost算法特性

    Boosting算法提升算法是一种常见的统计学习方法,其作用为将弱的学习算法提升为强学习算法.其理论基础为:强可学习器与弱可学习器是等价的.即在在学习中发现了’弱学习算法’,则可以通过某些方法将它特生...

    2017-12-18 16:55
    931
  • sklearn中的朴素贝叶斯算法

    sklearn中的朴素贝叶斯分类器之前理解朴素贝叶斯中的结尾对sklearn中的朴素贝叶斯进行了简单的介绍. 此处对sklearn中的则对sklearn中的朴素贝叶斯算法进行比较详细介绍.不过手下还...

    2017-12-17 13:03
    610
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部