![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Pory
这个作者很懒,什么都没留下…
展开
-
经典的开源机器学习软件
天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源软转载 2014-06-10 19:58:50 · 1054 阅读 · 0 评论 -
windows编译xgboost-python,不用vs编译
stackoverflow上看到的,是我所看到最方便的方式。原文:http://stackoverflow.com/questions/33749735/how-to-install-xgboost-package-in-python-windows-platformSo here's what I did to finish a 64-bit build on W转载 2016-12-26 22:52:45 · 1106 阅读 · 0 评论 -
机器学习实战之决策树(1)---ID3算法与信息熵,基尼不纯度
机器学习实战之决策树(1)---ID3算法与信息熵,基尼不纯度2014-12-2阅读552 评论0(1)关于ID3算法百度文库有一篇十分详细的文章,介绍看一个例子,给出了具体的计算过程。文章链接:http://wenku.baidu.com/view/7933c2f6f61fb7360b4c65fd.html这是最后的决策树的形状,来源是百[原]机器转载 2015-07-07 16:10:26 · 2246 阅读 · 0 评论 -
机器学习中的数学-模型组合(Model Combining)之Boosting与Gradient Boosting
文章出处:http://leftnoteasy.cnblogs.com。关于机器学习的博文都很不错Boosting方法: Boosting这其实思想相当的简单,大概是,对一份数据,建立M个模型(比如分类),一般这种模型比较简单,称为弱分类器(weak learner)每次分类都将上一次分错的数据权重提高一点再进行分类,这样最终得到的分类器在测试数据与训练数据上都可以得到比较好转载 2015-07-07 21:32:45 · 1068 阅读 · 0 评论 -
机器学习有很多关于核函数的说法,什么是核函数?核函数的作用是什么?
转自知乎详细的公式什么的,网络上搜索kernel function, kernel methods 有很多,我就不仔细说了,简单地说说背后的intuition。intuition也很简单,比如我们有一个一维的数据分布是如下图的样子,你想把它用一个直线来分开,你发现是不可能的,因为他们是间隔的。所以不论你画在哪,比如绿色竖线,都不可能把两个类分开。但是我们使用一个简单的升转载 2015-07-03 15:09:43 · 2632 阅读 · 1 评论 -
机器学习中的算法-决策树模型组合之随机森林与GBDT
文章出处:http://www.cnblogs.com/LeftNotEasy/决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。 模型组合(比如说有Boostin转载 2015-07-07 21:35:53 · 572 阅读 · 0 评论 -
python 中 常用到的 numpy 函数 整理
1. 创建二维数组 array() :set = array([[1., 2, ],[3., 4.],[5., 6.],[7., 9.]])求 数组的 行数:>>> set.shape[0]4求 数组的列数:>>> set.shape[1]>>> set.shape(4, 2)>>> set.dtyp转载 2015-06-28 09:58:46 · 539 阅读 · 0 评论 -
hadoop2.4.1集群环境搭建
本文(亲测实录)主要列出在安装hadoop 2.4.1过程中各个文件配置情况,其他步骤请参考网络其他资源进行操作1、JDK安装和SSH互信(略过)2、各节点IP和hostname如下(各节点需配置)[hadoop@master ~]$ cat /etc/hosts127.0.0.1 localhost100.12.56.221 slave-1100.12.5原创 2014-08-17 16:24:05 · 900 阅读 · 0 评论 -
Hadoop源码编译,hadoop-2.4.1+Lubuntu(Ubuntu)
先从Hadoop官网上面下载最新的源码,我的是2.4.1版本。jieya原创 2014-08-11 20:07:45 · 1897 阅读 · 0 评论 -
强大的矩阵奇异值分解(SVD)及其应用
本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。特征值和奇转载 2014-07-25 19:05:37 · 538 阅读 · 0 评论 -
WEKA使用教程(完整版)
目录 1. 简介2. 数据格式3.数据准备4. 关联规则(购物篮分析)5. 分类与回归6. 聚类分析1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名转载 2014-06-15 16:53:12 · 2453 阅读 · 0 评论 -
[转]逻辑回归代价函数及其梯度下降公式
前言在上一篇随笔里,我们讲了Logistic回归cost函数的推导过程。接下来的算法求解使用如下的cost函数形式:简单回顾一下几个变量的含义:表1 cost函数解释x(i)每个样本数据点在某一个特征上的值,即特征向量x的某个值y(i)每个样本数据的所属类别标签m样本数据点的个数hθ(x)样本数据的概率密度函数,即某个数据属于1类(二分类问题)的概率J(θ)代价函数,估计样本属于某类的风险程度,越...转载 2018-07-08 17:43:26 · 335 阅读 · 0 评论