- 博客(20)
- 资源 (39)
- 收藏
- 关注
转载 SVM入门(十)将SVM用于多类分类
SVM入门(十)将SVM用于多类分类从 SVM的那几张图可以看出来,SVM是一种典型的两类分类器,即它只回答属于正类还是负类的问题。而现实中要解决的问题,往往是多类的问题(少部分例外,例如垃圾邮件过滤,就只需要确定“是”还是“不是”垃圾邮件),比如文本分类,比如数字识别。如何由两类分类器得到多类分类器,就是一个值得研究的问题。还以文本分类为例,现成的方法有很多,其中一种一劳永逸的方
2015-01-30 16:14:47 1177
转载 SVM入门(九)松弛变量(续)
SVM入门(九)松弛变量(续)接下来要说的东西其实不是松弛变量本身,但由于是为了使用松弛变量才引入的,因此放在这里也算合适,那就是惩罚因子C。回头看一眼引入了松弛变量以后的优化问题:注意其中C的位置,也可以回想一下C所起的作用(表征你有多么重视离群点,C越大越重视,越不想丢掉它们)。这个式子是以前做SVM的人写的,大家也就这么用,但没有任何规定说必须对所有的松弛变量都使用同一个
2015-01-30 15:37:45 1929
转载 SVM入门(八)松弛变量
SVM入门(八)松弛变量现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的。就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了)。现在想象我们有另一个训练集,只比原先这个训练集多了一篇文章,映射到高维空间以后(当然,也使用了相同的核函数),也就多了一个样本点,但是这个样本的位置是这样的:
2015-01-30 14:53:43 1023
转载 SVM入门(七)为何需要核函数
SVM入门(七)为何需要核函数生存?还是毁灭?——哈姆雷特可分?还是不可分?——支持向量机之前一直在讨论的线性分类器,器如其名(汗,这是什么说法啊),只能对线性可分的样本做处理。如果提供的样本线性不可分,结果很简单,线性分类器的求解程序会无限循环,永远也解不出来。这必然使得它的适用范围大大缩小,而它的很多优点我们实在不原意放弃,怎么办呢?是否有某种方法,让线性不可分的数据变得线
2015-01-30 14:07:12 944
转载 SVM入门(六)线性分类器的求解——问题的转化,直观角度
SVM入门(六)线性分类器的求解——问题的转化,直观角度让我再一次比较完整的重复一下我们要解决的问题:我们有属于两个类别的样本点(并不限定这些点在二维空间中)若干,如图,圆形的样本点定为正样本(连带着,我们可以把正样本所属的类叫做正类),方形的点定为负例。我们想求得这样一个线性函数(在n维空间中的线性函数):g(x)=wx+b使得所有属于正类的点x+代入以后有g(x+)
2015-01-30 13:31:51 752
转载 SVM入门(五)线性分类器的求解——问题的描述Part2
SVM入门(五)线性分类器的求解——问题的描述Part2从最一般的定义上说,一个求最小值的问题就是一个优化问题(也叫寻优问题,更文绉绉的叫法是规划——Programming),它同样由两部分组成,目标函数和约束条件,可以用下面的式子表示:(式1)约束条件用函数c来表示,就是constrain的意思啦。你可以看出一共有p+q个约束条件,其中p个是不等式约束,q个等式约束。关于
2015-01-29 23:34:12 735
转载 SVM入门(四)线性分类器的求解——问题的描述Part1
SVM入门(四)线性分类器的求解——问题的描述Part1上节说到我们有了一个线性分类函数,也有了判断解优劣的标准——即有了优化的目标,这个目标就是最大化几何间隔,但是看过一些关于SVM的论文的人一定记得什么优化的目标是要最小化||w||这样的说法,这是怎么回事呢?回头再看看我们对间隔和几何间隔的定义:间隔:δ=y(wx+b)=|g(x)|几何间隔: 可以看出δ=||w|
2015-01-29 22:46:47 837
转载 SVM入门(一)至(三)Refresh
原作者的这篇文章讲的svm的确很通俗易懂……(一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本
2015-01-29 21:36:52 871
转载 深入探讨 Java 类加载器
类加载器是 Java 语言的一个创新,也是 Java 语言流行的重要原因之一。它使得 Java 类可以被动态加载到 Java 虚拟机中并执行。类加载器从 JDK 1.0 就出现了,最初是为了满足 Java Applet 的需要而开发出来的。Java Applet 需要从远程下载 Java 类文件到浏览器中并执行。现在类加载器在 Web 容器和 OSGi 中得到了广泛的使用。一般来说,Java 应用
2015-01-24 12:51:07 518
转载 linux 下sed使用
sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换、删除、新增、选取等特定工作,下面先了解一下sed的用法sed命令行格式为: sed [-nefri] ‘command’ 输入文本 常用选项: -n∶使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般
2015-01-07 22:04:22 636
原创 solr在使用solrj操作中的各个操作大全(在solrcores中测试)
package com.fjsh.SearchJobsFirst;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import java.util.GregorianCalendar;import java.util.HashMap;import java.util.I
2015-01-07 13:35:08 43301 3
原创 solr 中的group使用说明
参数说明param nameparam valuedescriptiongrouptrue/falseif true, turn on result groupinggroup.field[fieldname]Group
2015-01-07 13:31:38 8541 3
转载 JVM调优总结 -Xms -Xmx -Xmn -Xss
堆大小设置JVM 中最大堆大小有三方面限制:相关操作系统的数据模型(32-bt还是64-bit)限制;系统的可用虚拟内存限制;系统的可用物理内存限制。32位系统下,一般限制在1.5G~2G;64为操作系统对内存无限制。我在Windows Server 2003 系统,3.5G物理内存,JDK5.0下测试,最大可设置为1478m。典型设置:java -Xmx3550m -Xms355
2015-01-06 13:00:28 604
转载 浅谈SQL SERVER中事务的ACID
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)所应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability).这是可靠数据库所应具备的几个特性.下面针对这几个特性进行逐个讲解.理解原子性(Atomicity) 原子性意味着数据库中的事务执行是作为原子。即不可再分
2015-01-05 19:38:05 587
转载 hbase性能调优
本文主要介绍软件层面的性能调优。故,在此之前,请检查硬件状况。硬盘推荐SSD,一般SATA即可。网络千兆以上。可以安装Ganglia等工具,检查各节点的各硬件的运作状态:CPU,Memo,网络等等。 一、调整参数入门级的调优可以从调整参数开始。投入小,回报快。 1. Write Buffer Size快速配置Java代码 收藏代码HTable htable = new HTable(config,
2015-01-05 16:45:52 920
转载 Eclipse 找不到或无法加载主类
做项目过程中,更新了一下SVN,把自己机器上代码更新成了最新版本,可是在运行程序时发现Eclipse提示:“错误: 找不到或无法加载主类……”。发现根本就没有生成.class文件,也即没有时行编译。后来连错误提示也没有了,点击“build project"后一点反应都没有,不能编译。最后才发现自己犯的错误好低级:工程中的src文件夹不是”源文件包“形式了,显示的是普通文件夹的样式。解决办法
2015-01-05 13:20:40 1422
原创 hive整合hbase并做测试
基于Hadoop+Hive架构对海量数据进行查询:http://blog.csdn.net/kunshan_shenbin/article/details/7105319 HBase 0.90.5 + Hadoop 1.0.0 集成:http://blog.csdn.net/kunshan_shenbin/article/details/7209990第一步,启动hadoop,
2015-01-04 22:24:02 848
原创 hbase 安装及简单测试
HBase安装 hadoop集群:hadoop1.2.1master 192.168.1.161slave01 192.168.1.163slave02 192.168.1.164slave03 192.168.1.165slave04 192.168.1.166 hbase版本: hbase0.94 1、修改hadoop hdfs-sit
2015-01-04 18:00:06 3029
原创 javax.jdo.JDOFatalDataStoreException: Failed to create database 'metastore_db', see the next excepti
FAILED: Error in metadata: javax.jdo.JDOFatalDataStoreException: Failed to create database 'metastore_db', see the next exception for details.NestedThrowables:java.sql.SQLException: Failed to crea
2015-01-02 23:55:18 4110
原创 在ubuntu下安装并测试pig以及常见的问题
1 安装 只安装在namenode节点上即可 1.1 下载并解压 下载:http://pig.apache.org/releases.html下载pig-0.12.1版本的pig-0.12.1.tar.gz 存放路径:/home/Hadoop/解压:tar -zxvf pig-0.12.1.tar.gz 改名:mv pig-0.12.1 pig 然后放到/usr/local/h
2015-01-01 22:59:15 3774
流程引擎之compileflow idea 2024.*插件支持
2024-05-27
SkyAR完整代码+依赖文件:checkpoints-G-coord-resnet50
2023-06-11
视频换天造物实践秒变科幻大片实践相关资料:checkpoints-G-coord-resnet50
2023-06-11
gradle-4.3&jdk10-mac.zip|gradle-4.3&jdk10-mac.zip
2020-11-07
spi-demo java spi小例子
2019-02-12
java垃圾回收以及jvm参数调优概述
2017-06-18
maven+springMVC+mybatis+velocity+mysql+junit 代码生成器
2016-11-06
maven+springMVC+mybatis+velocity+mysql+junit项目框架搭建
2016-11-06
IK源码及讲解中的测试代码
2014-12-09
solr4.7示例包含需要的jar包
2014-03-19
抽象工厂模式简洁介绍附带net简单用例代码如果你还不理解是老天爷的错
2013-05-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人