SVM
lionzl
轻财足以聚人,律己足以服人,量宽足以得人,身先足以率人
展开
-
LIBSVM
LIBSVM求助编辑百科名片 LIBSVM的参数优化LIBSVM是台湾大学林智仁(Lin Chih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利转载 2012-11-29 16:46:16 · 860 阅读 · 0 评论 -
机器学习之开源库大总结
机器学习之开源库大总结 研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的数据挖掘与机器学习软件(库)目前也十分必需,现在就跟大家介绍下比较流行和常用的机器学习开源库。 以前在学校用过matlab,说实话真方便,通常一个模型只要几十行甚至十几行代码就能搞定,但是正版ma转载 2014-07-08 10:36:17 · 708 阅读 · 0 评论 -
Content indexing in Django using Apache Tika
Content indexing in Django using Apache Tika01 February 2012For the Documents module of our new open-source Generic Intranet, we need to be able to extract the text content and metadata from var转载 2013-03-02 18:56:52 · 811 阅读 · 0 评论 -
Python Tika guide
Python Tika guideIMPORTANT NOTE: Thanks to Chris Wilson's work it seems that a simple command linepip install git+git://github.com/aptivate/python-tika.git will do the work ! Much better isn't it翻译 2013-03-02 18:50:51 · 1973 阅读 · 0 评论 -
深入浅出之正则表达式
深入浅出之正则表达式分类: 基础知识/Basic Knowledge 2007-11-11 20:535433人阅读 评论(10)收藏 举报正则表达式引擎regex正则表达式工具perl.net这篇文章很重要,直接帖过来保存。出处http://dragon.cnblogs.com/archive/2006/05/08/394078.html转载 2013-03-08 20:52:10 · 615 阅读 · 0 评论 -
使用 Python 进行线程编程
使用 Python 进行线程编程线程的使用模式Noah Gift, 软件工程师, Giftcs简介: 通过将线程和队列 结合在一起,可以轻松地在 Python 中完成线程编程。本文将研究同时使用线程和队列,创建一些简单但有效的模式,以解决需要并发处理的问题。发布日期: 2008 年 7 月 31 日 级别: 中级 其他语言版本: 英文访问情况 :转载 2013-03-07 02:10:24 · 711 阅读 · 0 评论 -
Bag of features
Bag of features分类: Android 算法2011-08-02 21:22 2877人阅读 评论(27)收藏 举报 matlab+VC 实现Bag of features Bag of feat转载 2013-02-23 09:17:31 · 714 阅读 · 0 评论 -
数据挖掘之分类(kNN算法的描述及使用)
数据挖掘之分类(kNN算法的描述及使用) 博客分类:算法和数据结构数据挖掘算法SpringHibernatelucene /** *作者:张荣华 *日期:2008-2-23 **/数据挖掘之分类系列文章之前说到分类的基本概念以及一个文本分类的实例,原文地址见:http://www.iteye.com/topic/163285转载 2013-01-02 00:57:04 · 901 阅读 · 0 评论 -
LIBSVM使用介绍
LIBSVM使用介绍1.首先从主页上下载libsvm、Python2.5.2和gnuplot 三个软件。 http://www.csie.ntu.edu.tw/~cjlin/2.准备好数据,首先要把数据转换成Libsvm软件包要求的数据格式为: label index1:value1 index2:value2 ... 其中对于分类来说label为类标识,指定数据的种类转载 2012-12-04 16:09:06 · 487 阅读 · 0 评论 -
一些有用的 machine learning 工具箱
一些有用的 machine learning 工具箱分类: 机器学习 2010-01-20 12:14 237人阅读 评论(0)收藏 举报[www.csie.ntu.edu.tw/~cjlin/libsvm / *LibSVM*][http://www.cs.waikato.ac.nz/ml/weka/ *Weka*][http://yale.转载 2012-12-04 17:04:57 · 802 阅读 · 0 评论 -
文本分类入门
文本分类入门分类: 数据挖掘 NLP/IR2012-03-04 02:08 991人阅读 评论(8)收藏 举报最近要做文本分类相关的课程project,因此上网找了一下文本分类的资料,下面这个感觉比较通俗易懂,收录在这里。来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All转载 2012-12-02 16:23:33 · 1090 阅读 · 2 评论 -
文本分类入门(十一)特征选择方法之信息增益
文本分类入门(十一)特征选择方法之信息增益前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与类别间的关联性来进行这个量化,关联性越强,特征得分越高,该特征越应该被保留。在信息增益中,重要性转载 2012-11-30 11:33:41 · 648 阅读 · 0 评论 -
文本分类入门(番外篇)特征选择与特征权重计算的区别
文本分类入门(番外篇)特征选择与特征权重计算的区别在文本分类的过程中,特征(也可以简单的理解为“词”)从人类能够理解的形式转换为计算机能够理解的形式时,实际上经过了两步骤的量化——特征选择阶段的重要程度量化和将具体文本转化为向量时的特征权重量化。初次接触文本分类的人很容易混淆这两个步骤使用的方法和各自的目的,因而我经常听到读者有类似“如何使用TFIDF做特征选择”或者“卡方检验量化权重后每转载 2012-11-30 11:32:38 · 537 阅读 · 0 评论 -
TF-IDF
TF-IDF维基百科,自由的百科全书跳转到: 导航、 搜索TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与文本挖掘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频转载 2012-11-30 01:01:38 · 1098 阅读 · 2 评论 -
SVM算法入门
SVM算法入门转自:http://blog.csdn.net/yangliuy/article/details/7316496SVM入门(一)至(三)Refresh按:之前的文章重新汇编一下,修改了一些错误和不当的说法,一起复习,然后继续SVM之旅.(一)SVM的简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的转载 2012-11-29 16:35:27 · 599 阅读 · 0 评论 -
Relation Extraction中SVM分类样例unbalance data问题解决 -松弛变量与惩罚因子
Relation Extraction中SVM分类样例unbalance data问题解决 -松弛变量与惩罚因子2012-11-06 13:03 5519人阅读 评论(2) 收藏 举报 分类:NLP/IR(14) 数据挖掘(18) 版权声明:本文为博主原创文章,未经博主允许不得转载。1、问题描述做关系抽取就是要从产品评论中转载 2015-12-13 16:43:00 · 571 阅读 · 0 评论