关闭
当前搜索:

CART树剪枝的操作的理解

这里我就简单讲下CART剪枝的核心思想,纯属个人意见,如有不当,请指正。 在《统计学习方法法》中已经提到了决策树的剪枝算法了,理所当然,我们是顺着书中提到的思路来理解下决策树剪枝的关键步骤。我们定义了 该定义表示了决策树的损失函数。whaterver它是什么,现在有了损失函数这个衡量标准,并且假设我们已经根据training set生成了一棵复杂的决策树,且参数已知。算法该如何实现决策树的...
阅读(46) 评论(0)

图的幂律度分布 power-law degree distributios

讲的一篇图论文中说到,“The natural graphs commonly found in the real-worldhave highly skewed power-law degree distributios……”,开始只是了解个大概,后来经查才知道。power-law degreedistributios原来是一种描述网络图中结点度的分布,中文可叫做“幂律度分布”。 维基百科词条...
阅读(6) 评论(0)

关于感知学习模型机中空间任一点到超平面的距离公式的推导过程

关于感知学习模型机中空间任一点到超平面的距离公式的推导过程 在感知机模型中,输入空间中任意一点 到超平面S的距离: 其推导过程如下:...
阅读(18) 评论(0)

EM算法的两种理解角度

最近在学习机器学习这门课,目前学到了EM算法的部分。在网上看到了一些人比较好的理解。在此记录下来 EM算法即“期望极大算法”。学过机器学习的朋友都知道EM算法分两步:E步求期望,M步求极大。但是期望是求谁的期望,极大是求谁的极大呢?这里面其实有两种解读角度。 “通俗”角度 通俗角度的话,求极大肯定是求似然函数的极大了,而且一般都是对数似然。我们一般解决模型参数求解问题,都是在给定数据的情...
阅读(13) 评论(0)

Bagging和Boosting概念以及区别

Bagging和Boosting 概念及区别   Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个性能更加强大的分类器,更准确的说这是一种分类算法的组装方法。即将弱分类器组装成强分类器的方法。 首先介绍Bootstraping,即自助法:它是一种有放回的抽样方法(可能抽到重复的样本)。 1、Bagging (bootstrap aggregating)...
阅读(24) 评论(0)

Vim常用操作

在正常模式下(按ESC进入)按键v进入可视化模式,然后按键盘左右键或h,l键即可实现文本的选择。 其它相关命令: v:按字符选择。经常使用的模式,所以亲自尝试一下它。 V:按行选择。这在你想拷贝或者移动很多行的文本的时候特别有用。 CTRL+v:按块选择。非常强大,只在很少的编辑器中才有这样的功能。你可以选择一个矩形块,并且在这个矩形里面的文本会被高亮。 值得注意的是如果VI...
阅读(29) 评论(0)

随机森林

一、决策树 决策树是机器学习最基本的模型,在不考虑其他复杂情况下,我们可以用一句话来描述决策树:如果得分大于等于60分,那么你及格了。 这是一个最最简单的决策树的模型,我们把及格和没及格分别附上标签,及格(1),没及格(0),那么得到的决策树是这样的 但是我们几乎不会让计算机做这么简单的工作,我们把情况变得复杂一点 引用别的文章的一个例子 这是一张女孩对于不同条件的男性是...
阅读(50) 评论(0)

统计学习方法——模型的选择与评估(过拟合、泛化能力)

这是一些机器学习中用到的比较基本的概念 监督学习的目的是找到一个输入输出映射(模型),使得这个模型不仅对训练数据有很好的拟合能力,对于未知数据,它也有很好的预测能力。这篇博客介绍选择和评估模型的标准。本篇博客一共有以下几个重点:训练误差与测试误差、泛化能力、过拟合。 训练误差与测试误差 训练误差是模型关于训练集的平均损失来表示: 其中为训练集中数据的个数;损失函数在...
阅读(74) 评论(0)

Centos创建用户几组的相关命令

在centos中增加用户adduser而创建用户组我们使用groupadd命令,这个是不是非常的方便呀,其实复杂点的就是用户的组与组权限的命令了,下面来给各位介绍一下吧。 1、建用户: adduser phpq                            //新建phpq用户 passwd phpq                            //给php...
阅读(78) 评论(2)

Linux(CentOS)下安装JDK

1.准备工作   a.因为Java JDK区分32位和64位系统,所以在安装之前必须先要判断以下我们的Centos系统为多少位系统,命令如下:     uname -a     解释:如果有x86_64就是64位的,没有就是32位的。后面是X686或X86_64则内核是64位的,i686或i386则内核是32位的          由此可以判断我的centos为32位系统,故而我需要...
阅读(58) 评论(1)

Linux下tar解压命令

tar -c: 建立压缩档案 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。 -z:有gzip属性的 -j:有bz2属性的 -Z:有compress属性的 -v:显示所有过程 -O:将文件解开到标准输出...
阅读(53) 评论(0)

Ubuntu upgrade错误的处理方法

Ubuntu上进行sudo apt-get upgrade后出现异常,升级失败。 异常信息如下: E: dpkg was interrupted, you must manually run 'dpkg --configure -a' to correct the problem 按照提示输入:sudo dpkg --configure -a后仍不能升级,继续异常。 异常信息如下:...
阅读(62) 评论(0)

局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍

局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍 本文主要介绍一种用于海量高维数据的近似最近邻快速查找技术——局部敏感哈希(Locality-Sensitive Hashing, LSH),内容包括了LSH的原理、LSH哈希函数集、以及LSH的一些参考资料。 一、局部敏感哈希LSH 在很多应用领域中,我们面对和需要处理的数据往往是...
阅读(85) 评论(0)

Eclipse中堆内存的设置

最近在做项目测试的时候遇到了一些问题,是为了测试项目能支持的最大规模,其中在代码中遇到了一些问题,就是要设置JVM的一些heap的参数 所以上网搜索总结了一下 1.参数的含义 -vmargs -Xms256m -Xmx512m -XX:PermSize=256M -XX:MaxPermSize=512M -vmargs 说明后面是VM的参数,所以后面的其实都是JVM的参数了 -Xms25...
阅读(81) 评论(0)

JAVA中使用JDBC插入大量mysql中的数据

最近在拓展Giraph的功能,是为了可以支持Giraph这个系统存储更多的数据 后来在老师的建议下内嵌了MySQL,其实一点原创性都没有TAT,为了应付深圳项目的测试先这样吧,但是做的工作还是挺多的 其中为了快速的向Mysql中嵌入大量的数据而查资料知道这样的方法 如下文 使用JDBC连接MySQL数据库进行数据插入的时候,特别是大批量数据连续插入(100000),如何提高效率呢? 在J...
阅读(60) 评论(0)

SSH传输文件相关命令

利用ssh传输文件 在linux下一般用scp这个命令来通过ssh传输文件。 1、从服务器上下载文件 scp username@servername:/path/filename /var/www/local_dir(本地目录)  例如scp root@192.168.0.101:/var/www/test.txt  把192.168.0.101上的/var/www/tes...
阅读(92) 评论(0)

JAVA IO操作

import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.FileWriter; import java.io.IOException; import java.io.PrintStream; import java.io.PrintWrite...
阅读(57) 评论(0)

JAVA String.split()方法

在java.lang包中有String.split()方法,返回是一个数组 我在应用中用到一些,给大家总结一下,仅供大家参考: 1、如果用“.”作为分隔的话,必须是如下写法,String.split("\\."),这样才能正确的分隔开,不能用String.split("."); 2、如果用“|”作为分隔的话,必须是如下写法,String.split("\\|"),这样才能正确的分隔开,不能用...
阅读(124) 评论(0)

Ubuntu下MySQL简单操作

安装 Ubuntu下安装常规软件都比较简单,直接使用apt-get即可。安装步骤如下: 输入mysql命令 系统会提示没有安装这个软件,如下图: 根据系统提示,执行下面命令进行安装。 $ sudo apt-get install mysql-client-core-5.6 $ sudo apt-get install mariadb-client-core-10.0 之后...
阅读(126) 评论(0)

局部敏感哈希 LSH 介绍

局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍 本文主要介绍一种用于海量高维数据的近似最近邻快速查找技术——局部敏感哈希(Locality-Sensitive Hashing, LSH),内容包括了LSH的原理、LSH哈希函数集、以及LSH的一些参考资料。 一、局部敏感哈希LSH 在很多应用领域中,我们面对和需要处理的数...
阅读(108) 评论(0)
89条 共5页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:17833次
    • 积分:901
    • 等级:
    • 排名:千里之外
    • 原创:71篇
    • 转载:18篇
    • 译文:0篇
    • 评论:4条
    最新评论